Web Mining und Web Usage Mining mit dem RapidMiner

Seminarinformationen

Seminar - Ziel

Sie erhalten eine Einführung in den Bereich des Web Mining und der Web Analytics. Themenbereiche wie Webcrawler, automatisierte Webseitenklassifikation und -clustering und die Informationsextraktion aus Webseiten werden abgedeckt. Die vorgestellten Methoden können u.a. für den Aufbau von personalisierten News Agents, der Analyse von Webseiten und Web Log Dateien sowie für die Optimierung von Webseiten oder Webshops dienen. In Kombination mit einer Warenkorbanalyse kann dies hin bis zu personalisierten Empfehlungssystemen führen, welche mittels Up-Selling und Cross-Selling die Abverkäufe steigern. Sie werden lernen wie RapidMiner mit einem Webcrawler verbunden werden kann, wie Webseiten automatisch gesammelt und verarbeitet werden können und wie Klassikatoren für Webseiten oder Blogeinträge automatisch erzeugt werden können. Diese Klassifikatoren können z.B. Inhalte klassifizieren, Benutzerpräferenzen abbilden oder die Stimmung von Webtexten z.B. über das eigene Unternehmen analyieren (Sentiment Classification). Darüber hinaus zeigt dieser Kurs wie Informationen aus Webseiten automatisch via XPath oder regulären Ausdrücken extrahiert werden können. Dieser Kurs demonstriert außerdem wie Webservices wie die Amazon API (z.B. zur Extraktion von Produktinformationen) oder die Google API (z.B. zur Extraktion von geographischen Informationen) in den Analyseprozess integriert werden können. Zahlreiche praktische Übungen für verschiedene Bereiche wie adaptive personalisierte Newsfilter, Sentiment Classifications und die inhaltsbasierte Klassifikation von Webtexten erlauben den Transfer des gewonnenen Wissens auf eine eigene Web Mining Problematik.

Teilnehmer - Zielgruppe

Entscheidungsträger, Analysten, Anwender, Entwickler, Administratoren

Kurs - Voraussetzungen

grundlegende PC Kenntnisse, Grundkenntnisse der Mathematik von Vorteil

Seminardauer

  • 2 Tage
  • 09:00 Uhr bis 17:00 Uhr

Schulungsunterlagen

  • nach Absprache

Seminar-Inhalt / Agenda

  • Grundlagen des Data Minings mit RapidMiner
  • Einführung in Data Mining für Texte oder Web
  • Verküpfung eines Webcrawlers mit RapidMiner

Vorverarbeitung von Textdaten

  • Tokenizing
  • Tagging
  • Term Frequencies
  • Document Frequencies
  • TFIDF

Maschinelles Lernen für Text Mining

  • Naive Bayes und Support Vector Machines

Automatische Klassifikation von Texten

  • Klassifizierung von Webseiten, Blogs oder Diskussionsbeiträgen abhängig von ihrem Inhalt, von Benutzerpräferenzen oder Stimmungen (Sentiment Classification)

Text Clustering

  • Automatische Segmentierung von Webseiten oder anderen Texten in Gruppen ähnlicher Dokumente
  • Informationsextraktion mittels XPath und regulären Ausdrücken
  • Integration der Amazon API und der Google API
  • Analyse von Web Logs und Web Log Mining
  • Grundideen des Aufbaus eines Empfehlungssystems für Webanwendungen und Webshops

Ausführliche praktische Übungen auf unterschiedlichen Datensätzen werden durchgeführt!

Weitere Schulungen zu Thema OLAP

IBM Cognos Analysis for Excel (CAFE)

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

Cognos Reporting in Excel

Exploratives Data Mining und Hochdimensionale Datenmodellierung mit RapidMiner

- u.a. in Nürnberg, Berlin, Stuttgart, München, Köln

Unser Seminar "Exploratives Data Mining und Hochdimensionale Datenmodellierung mit RapidMiner" ist eine kompakte zweitägige Einführung in die Grundlagen der explorativen Datenanalyse mit der Data Mining Software RapidMiner. Ein wichtiges Merkmal der explorativen Datenanalyse ...

Excel-Pivot 2007 mit Analysis Services 2005/2008 als Analysetool

- u.a. in Frankfurt am Main, Hannover, München, Essen, Darmstadt

In diesem 1-tägigen Seminar vermittel wir den Teilnehmern die Kenntnisse um mit Excel-Pivot eine Analyse- und Reportinglösung beim Zugriff auf ein Data Warehouse mit Cubes. Insbesondere wird auf das Zusammenspiel von Excel und den Analysis Services eingegangen. Zudem werden ...

Effektives Reporting mit Excel und PowerPivot in Office 2013

- u.a. in Hamburg, München, Paderborn, Essen, Mannheim

Innerhalb dieses dreitägigen Seminars vermitteln wir Ihnen die Kriterien für die Auswahl der richtigen Diagramme und Texte in Ihrem Berichtswesen. Dazu werden die Daten über Auswahldialoge dynamisiert und Sie lernen der Aufbau eines Management-Cockpits und des Dashboards. ...