Automatische Marktforschung
06 / 2007
en | de
Home
Icon

Das Telefon klingelt zum unpassendsten Zeitpunkt, und die Person am anderen Ende der Leitung muss gerade äusserst dringend und natürlich ausgerechnet von ihnen wissen, ob aus ihrer Sicht nun die Zahnpasta-Hersteller A oder nicht doch etwa Konkurrenz-Zahnpasta B eher eher das bessere 'Sauberkeitsgefühl nach 3.5 Putzbewegungen im rechten Mundwinkel' bietet? Und wie stark, auf einer Skala von 1 bis 10, Sie das Produkt C als 'cool', 'hässlich', 'qualitativ hochstehend' oder was auch immer betrachten, obwohl sie dieses nie jemals benutzt haben? Bei der nächsten Telefonumfrage zu Marktforschungszwecken werden Sie sich vielleicht sogar noch etwas mehr nerven, denn - ganz abgesehen davon dass viele dieser Umfragen statistisch nicht signifikant, langweilig und sehr teuer sind - sehr viele Resultate dieser Art liessen sich auch vollautomatisch direkt aus dem Internet generieren, und das nicht nur für einen fix gewählten einmaligen Zeitpunkt wie bei einer Umfrage, sondern als Realtime-Daten über eine beliebig lange Zeitdauer.

Die benutzer-generierten Inhalte im Internet (Blogs, Diskussionsforen, persönliche Homepages) sind in letzter Zeit extrem stark gewachsen und werden von der klassischen Marktforschung vielleicht immer noch unterschätzt. Es gibt im Internet immerhin rund 200'000 Blog-Einträge allein zum Thema 'Zahnpasta', die alle gratis und öffentlich verfügbar sind.

Untenstehende Visualisierung zeigt als Beispiel eine der einfachst-möglichen automatischen Auswertungen der Internet-Dokumente über einige (Auto-)Marken (in diesem Fall ein grosser Teil aller englischsprachigen Blog-Beiträge und Online-Newsmeldungen weltweit im Zeitraum Februar bis Juni 2007) nach gemeinsamen Erscheinen mit Attributen wie 'weiblich', 'männlich', 'ökologisch', 'familienfreundlich', 'arrogant', 'cool', 'billig', 'luxuriös' und weiteren Attributen. Dies ist hier natürlich in keiner Weise repräsentativ oder aussagekräftig, aber der Vorteil dieses Prinzips ist dass sehr grosse Mengen der entsprechenden Rohdaten jederzeit gratis auf dem Internet verfügbar sind, und - der Hauptvorteil - dass Veränderungen in der öffentlichen Wahrnehmung einer Marke/Firma/etc. fast in Echtzeit sehr einfach verfolgt werden können.

Falls Sie diesen Text lesen können haben sie wahrscheinlich kein Java installiert? (Version 1.4.2 oder neuer wird benötigt)

Get Java here.


Applet and Data © by Netbreeze GmbH

Bedeutung der Visualisierung:
Positioniert werden die Marken nach dem relativen Vorkommen zusammen mit dem gegebenen Attribut. Mini-Cooper steht beispielsweise Ende Juni bei 'cute' (niedlich, hübsch) auf 539%, aber auch bei 'arrogant' auf 200%. Das bedeutet dass das Wort 'cute' in der Zeitperiode vor Ende Juni 2007 etwa 5 mal häufiger in Zusammenhang* mit Mini-Cooper genannt wurde als im Durchschnitt aller Automarken, und 'arrogant' immerhin doppelt so häufig im Vergleich zum Durchschnitt. (Siehe auch Information beim Überfahren mit dem Mauszeiger)

* Als gemeinsames Vorkommen zählt in diesem Beispiel nur wenn beide Begriffe in demselben Paragraph vorkommen. Gewöhnliche Web-Suchmaschinen können dies nicht direkt zählen da z.B. bei Google nur nach Vorkommen in demselben Dokument (oder direkt aufeinanderfolgend) gesucht werden kann, nicht aber innerhalb strengerer Kriterien wie 'Vorkommen in demselben Satz', 'in demselben Paragraph' oder 'höchstens x Worte Abstand'. Netbreeze bietet u.a. diese erweiterten Suchfunktionen.

Bedienung des Applets:
Für die Achsen der Graphik lassen sich in den Menus die beiden gewünschten Attribute auswählen, um diese direkt über alle Marken vergleichen zu können. Mit dem Schieberegler lässt sich das Zeitfenster weiter in die Vergangenheit schieben, um den Zeitverlauf der Marken direkt verfolgen zu können. So sind immerhin 3468 verschiedene Darstellungen möglich. Haben Sie z.B. gewusst dass sich die beiden Marken VW und Mini-Cooper im 'ecological vs. cool'-Raum gerade in entgegengesetzter Richtung bewegt haben im angezeigten halben Jahr?

Obenstehende Visualisierung ist nur eine erste, sehr primitive Auswertung von einer unvollständigen Teilmenge der benutzer-generierten Inhalte des Internets. Die Qualität der Resultate lässt sich sicher stark verbessern einerseits durch Berücksichtigung von allen verfügbaren Daten, und andererseits durch intelligentere Analysemethoden, wie Sentiment Detection, Semantische Satzanalysen (Verneinungen etc.) und detailliertere statistische Methoden.

Links:

Netbreeze GmbH die Schweizer Firma Netbreeze baut 'Knowledge Generators' basierend auf Internet-Daten.
TNS Emnid Semiometrie™ Die Marktforschungs-Firma TNS Emnid bietet ihren Kunden im Bereich Brand-Positionierung eine ähnliche Visualisierung wie in obenstehenden Applet, allerdings ohne einen Zeitverlauf, nur in 2 Dimensionen und nicht auf Internet-Daten sondern auf Umfragen basiert. Auf der Website kann man selbst die Umfrage ausfüllen um seine persönliche Position im Raum zu bestimmen.
Prefuse interactive information visualization toolkit (Sehr gutes Java Open-Source Toolkit).
Google Blog Suche Blog-Suche nach 'Zahnpasta'.