Projekt InstaLOC, Aktuelle Statistiken

Der aktuelle Datenbestand umfasst:

587.903 Locations inkl. Geocodes, IDs und Namen
12.669.502 Unique Tagclouds
5.633.457 Beiträge ohne Locationzuordnung
8.516.617 Beiträge mit Locationzuordnung
4.863.200 codierte User
10.700.170 Unique Zeitstempel (Beiträge)

Die Masterdatenbank umfasst alle erfassten Datensätze und die Scrapingtechnologie schafft das genannte Volumen innerhalb von 3-4 Werktagen.

Projekt „Instagram, Interaktionen“ – Basisaccountanalyse(n)

Die Auswertungsanwendung verfügt nun über zwei Basisanalyseprozeduren. Diese sind:
Ausgabe der erfassten Likes zu einem bestimmten Accounts:

(1) Ergebnisse inkl. Tagclouds, Posturls, Postzeitpunkt und (beherzter) Influenceraccount
tg_05
tg_04
liberal
tg_03
tg_02
tg_01

(2) Ergebnisse inkl. beherzter Influencername und Aufsummierungen der Likes JE erfassten / beherzten Influencer
ta_06
ta_05
ta_04
ta_03
ta_02
ta_01

Diese Funktionen dienen einer ersten und sehr groben Erkenntnisgewinnung. Zu einem späteren Zeitpunkt werden die Prozeduren so zusammen gefasst, dass sich aus der Analyse eines Influencer (oder: Einsteiger)-accounts Likemuster der Interagierenden sichtbar machen lassen. Mir schwebt hierbei eine Influencer und / oder Tagcloudauflistung inkl. Gewichtung via Aufsummierung vor und ich muss hierzu noch einige Inspirationen suchen.

Projekt „Instagram, Interaktionen“ – Tagcloudanalysen

Die Abfrage für die nachfolgenden Datensätze ist:
select tagcloud, length(tagcloud), count(distinct(uid)), count(distinct(inflname)), count(distinct(postid)) from interakt where tagcloud like ''%'+abfrage+'%'' group by tagcloud;

Die aktuellen Ergebnisse beinhalten folgende Angaben:

(1) Tagcloud (tagcloud) (als substring)
(2) Zeichenkettenlänge der Tagcloud (length(tagcloud))
(3) Anzahl der Interaktionen // Anzahl der Interagierenden Accounts (count(distinct(uid))
(4) Anzahl der Influencer-Accounts (count(distinct(inflname))
(5) Anzahl der Postings (count(distinct(postid))

Alle Angaben verstehen sich als „je UNIQUE Tagcloud“ und DIE Tagcloud beschreibt die Tagsammlungen.

Beispieldatensätze (Excel, Download)
[Politik]
Download: christianlindner
Download: bundestagswahl
Download: bundestag
Download: dielinke

[Wohnung, Home & Living]
Download: badezimmer
Download: wohnzimmer
Download: kinderzimmer

[Städte]
Download: leipzig
Download: berlin

[Sonstiges]
Download: geschenk
Download: stricken

[Urlaub]
Download: urlaub
Download: strand
Download: meer

[Hinweise und allgemeine (!) Erklärungen]
Die Angabe zur Zeichenkettenlänge der jeweiligen Tagwolken liefert in Verbindung mit den Zahlen aus (3), (4) und (5) eine Interpretationsgrundlage für die Beantwortung folgender Fragen:
Wieviele Tags machen je Posting Sinn?
Welche Taghäufungen im Sinne der reinen Anzahl provozier(t)en wieviele Likes?
Exkludiert man nun besagte Zeichenkettenlänge aus der Datenbegutachtung, ergeben sich in Verbindung mit den Zahlen aus (3), (4) und (5) die Möglichkeit(en) zur Beantwortung folgender Fragen:
Welche Themen in Form der Tags „kommen an“?
Welche Themen in Form der Tags werden von wieviel Accounts wahrgenommen UND honoriert?
Welche Themen in Form der Tags werden von wieviel Accounts veröffentlicht?
Die Datensätze liefern einen relativ groben Überblick zu den gesuchten Themen. Sie geben analog zur genannten Abfrage keinerlei Auskunft zu den Postingzeiträumen und den konkreten Interagierenden / Influencern, da hier diese Angaben nicht mitgeliefert werden. Hier ist eine entsprechende Tiefenprüfung via erweiterter DB-Abfrage natürlich obligatorisch.

Anfragen, Nachfragen und generelle Gesprächsangebote bitte an office(at)pontipix.de.

Arbeitseinblick: Schwieriges Projekt & tolle Zahlen

Kurzfristig übernahmen wir die Arbeiten an einem Projekt der schwierigen Sorte im Bereich der Büroartikel & Verbrauchsmaterialien.

Ausgangszustand (Marketing):
‣ Sitemap mit ca. 75.000 Elementen,
‣ ca. 40.000 Produkte,
‣ diverse technische Mängel,
‣ kaum vorhandene Vermarktung der einzelnen Produkte mit Hilfe der üblichen Strategien,
‣ OVI-Wert bei ca. 1,08,
‣ kaum sichtbare Social-Media-Aktivitäten

Das Projekt hatte eine ungewöhnlich kurze Laufzeit von zwei Monaten (Juli bis August 2017) und bedurfte daher einer genau terminierten Vorgehensweise. Durch die vorhandene Tag- und Trenddatenbank (siehe Hashtagprojekt) gelang ein zügiger Einblick in die Branche des Klienten. Nach einer  kurzen Recherchephase wurden folgende Strategieelemente für die Promoarbeiten gewählt:

‣ Identifikation der lohnenswerten Knotenpunkte (hier: Kategorien mit nachgefragten Produkten)
‣ Linkaufbau für diese Kategorie-Seiten mit Hilfe stark frequentierter Kataloge und Blogs
‣ Linkaufbau für diese Kategorie-Seiten mit Hilfe der agentureigenen Pinterest-Accounts (manuell eingesetzte Quelle)
‣ Produktvermarktung mit Schwerpunkt auf Twitter

In der Projektlaufzeit konnten wir folgende Ergebnisse erzielen:

Grafik 1: Zuwachs der Besuche via SUMA von ca. 28 (Ende Juni) auf ca. 500 am Ende des Projektzeitraums Ende August
Zuwachs der Besuche via SUMA von ~28 (Ende Juni) auf 488 (17.August)

Grafik 2: Erhöhung des OVI-Index von 1,08 auf 3,45
Erhöhung des OVI-Index von 1,08 auf 2,12

Grafik 3: Erhöhung der rankenden Keywords von ca. 4100 auf ca. 9200

Projekt: Instagram-Hashtagdatenbank, Datenbankupdate und weitere Pläne

Die angelegte Datenbank hat nun den folgenden Umfang:

Datenbanküberblick:
Unique-Tags:556022
Anzahl: Tagdatensätze:1579353
Anzahl: Abfragepunkte:28818
Anzahl: Kategorien:117
Letztes Prüfdatum: 18.11.2016

Die hinterlegten Kategorien und Abfragepunkte decken derzeit relativ stark die meisten erfassbaren Themen des Alltags ab und ich werde die finale Version auf ein Volumen von ~3-5 Mio Unique-Tags erweitern.

Neben den realisierten Abfragefunktionen (Tagliste, Tagwolke) sind die folgenden Erweiterungen geplant:

(1) Detailabfragen nach Häufung
– Tagliste und Wolke inklusive der tagesaktuellen Häufung
– Erweiterung der Wolken um Durchschnittshäufungen
(2) Wortpaarprüfungen
– Ausgabe (allgemein, inkl. Häufungen) nach Wortzusammensetzungen (weihnachten+geschenk, geburtstag+geschen, usw.)
– Formate: Taglisten und Tagwolken
(3) Häufungsentwicklungen
– Einzelabfragen und Wortpaare
(4) Textanalysen
– Gegenproben von Texten auf die Datenbank
– Ausgabe der Häufungen
– Ausgabe der durchschnittlichen Häufungen
– Ausgabe der gefundenen Tags als Promovorschlag für die Socialmedia
(5) Alertsystem, Triggersystem
– Infosystem zu geänderten Häufungen
– Infosystem zu „neuen“ Tags
– Infosystem zu „neuen“ Wortpaaren
– Alerts: täglich, wöchentlich etc.

Wir diskutieren und analysieren derzeit intern noch diverse Datenfreigabemöglichkeiten neben der bekannten EMail-Schnittstelle. Im Moment sind die folgenden Optionen bei uns im Gespräch:
(a) Datenauszüge in den Formaten: XLS, JSON, SQL, CSV
(b) Reportings analog zu bspw. XOVI und andere Datendienstleister (PDF)

Projekt: Instagram-Hashtagdatenbank, Abfrage von Tagwolken

Die Abfragelogik für das Generieren dieser Hashtagwolken hat das folgende Schema:

wolke:[term],[mindesthäufung],[modus],[varianten],[limit]

Erklärungen zu den Variablen:
[term] beschreibt den gesuchten Begriff
[mindesthäufung] beschreibt, die Mindesthäufung der auszugebenden Wolkenelementen (=>Zahl)
[modus] beschreibt die Ausgabegenauigkeit
[varianten] beschreibt die Anzahl der auszugebenden Wolkenvarianten (=>Zahl)
[limit] beschreibt das Maximalvolumen der auszugebenden Wolkenelementen (=>Zahl)

Aktuelle Möglichkeiten von [modus] sind „ungenau“ (Term befindet sich irgendwo in den Zeichenketten) , „anfang“ (Term befindet sich am Anfang der Zeichenketten) und „ende“ (Term befindet sich am Ende der Zeichenketten).

Um nun an die gewünschten Ergebnisse zu gelangen, werden die zusammengesetzten Befehlszeilen via EMail-Betreff an die System-Adresse geschickt. Ich bitte hier zu beachten, dass diese „System-Adresse“ ausschließlich nach Rücksprache mit Anne oder mir freigegeben wird.

Beispiele sind:
wolke:leipzig,100,anfang,10,6
Variante: 1
#leipzighalle #leipzigleben #leipziglove #leipziggram #leipzigerbuchmesse2014 #leipzigtattoo
Variante: 2
#leipzigerbuchmesse2014 #leipzig #leipzigtravel #leipzigblogger #leipzigzoo #leipzig_downtown
Variante: 3
#leipziggay #leipzig_city #leipzigerbuchmesse2015 #leipzigartig #leipzigerleben #leipzigcitygirl
Variante: 4
#leipziggram #leipzigerland #leipzigtattooartist #leipzigerbuchmesse2015 #leipzigtravel #leipzigart
Variante: 5
#leipzigerland #leipziglovers #leipziggoesusa #leipzigart #leipziggram #leipzig_deine
Variante: 6
#leipzighalle #leipzigerbuchmesse2015 #leipzigerzoo #leipzigram #leipzig2013 #leipzigliebe
Variante: 7
#leipzigmarkt #leipzigtattooartist #leipzigcity #leipzigcityviews #leipzigtravel #leipzigram
Variante: 8
#leipzigerland #leipzig_deine #leipzigtattoo #leipzigerbuchmesse2016 #leipziglovee #leipzig2014
Variante: 9
#leipzig2013 #leipzigerbuchmesse2016 #leipzigerleben #leipziglove #leipzigerbuchmesse2015 #leipzig
Variante: 10
#leipzigerstr #leipziglife #leipzigtattooartist #leipzigarena #leipziger #leipziggermany

wolke:leipzig,100,ende,10,6
Variante: 1
#plagwitzleipzig #flughafenleipzig #leipzig #baumwollspinnereileipzig #visitleipzig #halloleipzig
Variante: 2
#iloveleipzig #lieblingsleipzig #ig_leipzig #thisisleipzig #leipzig #spinnereileipzig
Variante: 3
#weihnachtsmarktleipzig #spinnereileipzig #visitleipzig #leipzig #baumwollspinnereileipzig #thisisleipzig
Variante: 4
#visitleipzig #spinnereileipzig #weihnachtsmarktleipzig #plagwitzleipzig #flughafenleipzig #thisisleipzig
Variante: 5
#weihnachtsmarktleipzig #baumwollspinnereileipzig #plagwitzleipzig #leipzig #iloveleipzig #halloleipzig
Variante: 6
#thisisleipzig #baumwollspinnereileipzig #iloveleipzig #visitleipzig #ig_leipzig #halloleipzig
Variante: 7
#iloveleipzig #ig_leipzig #halloleipzig #thisisleipzig #leipzig #plagwitzleipzig
Variante: 8
#baumwollspinnereileipzig #plagwitzleipzig #ig_leipzig #spinnereileipzig #flughafenleipzig #weihnachtsmarktleipzig
Variante: 9
#flughafenleipzig #weihnachtsmarktleipzig #visitleipzig #thisisleipzig #baumwollspinnereileipzig #halloleipzig
Variante: 10
#ig_leipzig #plagwitzleipzig #lieblingsleipzig #halloleipzig #iloveleipzig #leipzig

wolke:leipzig,100,ungenau,10,6
Variante: 1
#leipzigbynight #leipzigerzoo #leipzigblogger #iloveleipzig #leipzigliest #leipziglove
Variante: 2
#leipzigerland #leipzigerplatz #leipzigtattoo #leipzigmarkt #leipzigskyline #leipzigläuft
Variante: 3
#leipzigerplatz #leipzigbookfair #leipzigcitygirls #leipzigblogger #leipziglife #leipzigcity
Variante: 4
#leipzigram #ig_leipzig #leipzigerbuchmesse #leipzighalleairport #leipzigerbuchmesse2016 #leipzigskyline
Variante: 5
#meinleipziglobichmir #leipzigartig #leipzigbookfair #leipzigläuft #erfurtleipzighalle #leipziglovee
Variante: 6
#leipzigtrip #leipzigerbuchmesse2015 #leipzigliebe #leipzigzoo #leipzigerbuchmesse2016 #leipzigerplatz12
Variante: 7
#leipzigerland #leipzigerbuchmesse2016 #flughafenleipzighalle #leipzigtravel #plagwitzleipzig #leipzigwest
Variante: 8
#visitleipzig #lieblingsleipzig #leipziglife #leipzigcityviews #leipzigtripp #leipzigtravel
Variante: 9
#leipziglife #erfurtleipzighalle #leipzigtattootermine #leipzig2013 #leipzigzoologicalgarden #leipzigerbuchmesse2015
Variante: 10
#flughafenleipzighalle #plagwitzleipzig #leipziggirl #leipzigerweihnachtsmarkt #leipzigtravel #leipziglovers

Projekt: Instagram-Hashtagdatenbank, Datenbanküberblick

Der folgende Datenbankauszug lässt sich über die freigeschaltete EMail-Schnittstelle mit Hilfe des Befehls „überblick“ abholen.

Unique-Tags: 57510
Anzahl: erfasste Tags:509918
Anzahl: Abfragepunkte:3754
Anzahl: Kategorien:55
Anzahl: Prüfungen:11
Letztes Prüfdatum: 13.11.2016

Zeitstempel – Überblick: 13.11.2016 15:11:47

Erklärungen zu den Angaben:
„Unique-Tags“ beschreibt die erfassten Einzeltags.
„Anzahl: erfasste Tags“ beschreibt die Einzeltags inklusive deren Entwicklungen über die Prüfzeiträume.
„Anzahl: Abfragepunkte“ beschreibt die Anzahl der Suchabfragen an den Tagsearch-API-Endpoint.
„Anzahl: Kategorien“ beschreibt die Kategorien, welche die Abfragepunkte einordnen (Sport, Essen & Trinken, Mode, etc.).
„Anzahl: Prüfungen“ beschreibt die durchgeführten Abfragen der an den Tagsearch-API-Endpoint bzgl. aller Kategorien.
„Letztes Prüfdatum“ beschreibt das Datum der letzten durchgeführten Prüfung.
„Zeitstempel – Überblick“ beschreibt den Zeitstempel des generierten Datenbanküberblicks

Updatenotiz zum Projekt „Instagram-Hashtag-Datenbank“

Nach einigen interessanten Diskussionen und Beobachtungen entschieden wir uns zu einem Systemwechsel.

Dies bedeutet:
– die Scripte und die Datenbanken werden zeitnah vom Server gelöscht
– die Reichweitendaten (Zeitraum: Sommer – 2015 bis Sommer 2016) werden archiviert und in das DB-Management eine Windows-Anwendung übertragen
– Reichweitenprüfzeiträume werden auf mindestens 15 Minuten getaktet

Durch den Übertrag auf eine Windows-Anwendung werden vor allem tiefergehende Interpretationsmöglichkeiten zu den Tags, den Themenwelten und den Medienhäufungen // Reichweiten möglich.
Ich werde mich bei passender Gelegenheit auf diesem Blog zu den Reports äußern und ggf. Beispieldatensätze veröffentlichen.