Accountanalyse (Instagram) – Update 0.3Beta

Mit Fertigstellung der Versionsnummer 0.3Beta lassen sich nun die Interaktionen in Form von Likes auf Instagram-Accounts prüfen. Hierfür nehme ich den folgenden Endpoint:

https://api.instagram.com/v1/media/[media-id]/likes?access_token=[token]

Wie sich der Token generieren lässt, habe ich im Artikel „Instagram-Token generieren“ dargestellt.
Die Datensätze für die Variable „[media-id]“ generiere ich aus dem Account-Scrape-Prozess, welcher die Rohdaten – beschrieben im Artikel „Instagram-Rohdaten“ – beinhalten (siehe letzte Spalte im Datensatz vom Account „hanneswobus“).

Die Datenanalyse erfolgt nun mit Hilfe einer einfachen Laufschleife über den o.g. Endpoint. Ich bitte an dieser Stelle um Verständnis darüber, dass ich hier nicht die Rohdaten aus dem „hanneswobus“-Account zeigen werde, da hier noch keine stabile Anonymisierungsprozedur vorliegt und wir prinzipiell keine personenbezogenen Datensätze zu diesen virtuellen Beziehungen freigeben. Die Betatester_innen und interessierte Bekannte, Freunde und Kolleg_innen können sich natürlich jederzeit gern mit ihren Accounts bei uns melden.

Die Struktur der ausgelesenen Datensätze hat bei unserer Anwendung nun die folgende Form

[Nr.]=>[Username]=>[URL]=>[ID]=>[Post-ID]

Die Spalte „Nr.“ hat eine eher kosmetische Funktion. Der Username lässt sich über den Endpoint-Respons und dessen Variable „username“ auslesen und die URL wird softwareseitig zusammengesetzt aus den Zeichenketten „https://www.instagram.com/“ + [username] + „/“. Die Spalte „ID“ umfasst die ausgelesenen IDs der likenden Accounts und die „Post-ID“ zeigt eine Querverbindung auf die ID der entsprechenden Posts, welche hier vom User geliked worden.

Natürlich sind die Rohdaten nur für Expert_innen interpretierbar und deswegen werden sie in weiteren Schritten verarbeitet. Diese sind: (a) Bereinigung der Liste „Account-Name“, (b) Zusammenzählen der getätigten Likes JE Accountname und (c) Sortieren der Liste im Modus „Absteigend“.

Die bereinigten Datensätze und die Rohdaten werden per sofort in die Socialmedia-Reports aufgenommen und entsprechend erläutert. Die Zahl „Likes“ findet nun auch ihren Platz in den Komplex „Social-Signals“.

Was kann man nun aus den Datensätzen erkennen?
(a) Fangewichtung
(b) aktive Fans – gezeigt durch hohes Likeaufkommen
(c) durch Rückkoppelung auf die Accountrohdaten: „beliebte“ Posts
(d) durch Rückkoppelung auf die Tags der Accountrohdaten: „beliebte“ Tags
(e) Fangemeinde, Likende Accounts etc. des Wettbewerbs
(f) Aktivitätsgründe durch Rückkoppelung auf unsere Hashtag-Reichweitenanalyse

[Todo für Versionsnummer 0.4Beta]
(a) Auslesen der Comments und kommentierenden Accounts analog zu den Likes
(b) Datenaufbereitung analog zu den Likes
(c) Vergleich: Likes, Comments im Verhältnis zu den Posts
(d) Diagramme: Verlauf, Vergleich etc. für die 10 aktivsten Accounts (Likes, Comments)
(e) Einbau der 10 aktivsten Accounts in die PDF / HTML-Reports der Software

Nach einigen und auch sehr intensiven Diskussionen haben wir uns zu einer Fandefinition entschieden, welche sich ausschließlich auf die Interaktion (hier: Likes, Comments, Likes UND Comments) bezieht.
Die kommende Versionsnummer wird den Komplex „Instagram-Datenerhebung“ und „Instagram-Monitoring“ abschließen und ich werde nahtlos ähnliche Funktionen für Pinterest entwickeln.

Accountanalyse (Instagram) – Update 0.3Beta

Die Software wurde nun auf die Tiefenanalyse der Tags erweitert. Hierbei werden die Tags aus den Rohdaten (siehe Artikel: Rohdaten) hinsichtlich der Häufung zusammengezählt und nach dem Verhältnis zu den Likes und Kommentaren gewichtet.

Die nachstehenden Bilder zeigen die Ergebnisse aus dem Account „hanneswobus“ mit den Daten aus hanneswobus_tags.xlsx.

Durch die Analysierbarkeit beliebiger (!) Accounts lässt sich nun dauerhaft nachprüfen, welcher Tag (natürlich in Verbindung mit dem Post und dem konkreten Motiv) am Besten den ROI-Vorstellungen (Likes, Comments, Likes & Comments) entspricht. Da die Erfassung der Accountrohdaten zu beliebigen Zeitpunkten (in Abhängigkeit zur Verfügbarkeit und Stabilität der Instagram-API) realisierbar ist, lassen sich auch Beobachtungen zu Wochentagen und äußeren Einflüssen wie Wetter, Trends und Events anstellen.

[Todo]
Gewichtung der Taggruppen analog zur Einzeltaganalyse.
Optional: Gegenprobe der Tags auf unserer Reichweitendatenbanken
Festlegung eines Reportformates (PDF, Excel, Word usw.).
Scrapen und Verarbeiten der Kommentierenden und Likenden Accounts

[Update]
Die Reichweitengegenprobe auf die bekannte und besprochene Datenbank wird (vorerst) mit niedriger Priorität behandelt und mit der Anbindung an die Tagsearch von Instagram kompensiert.
Der „Endpoint“ hierfür ist:
https://api.instagram.com/v1/tags/search?client_id=[deine_id]&q=[suchwort] und die Reichweite wird über die Variable „media_count“ ausgeliefert.
Der Rohdatensatz für die Tag <> Reichweitengewichtung für lässt sich hier: hanneswobus_tags herunter laden.

Die Reportausgabe wurde „modular“ gestaltet und die Basis hierfür ist „html“. Die PDF-Version eines solchen Reports befindet sich hier: Instagramauswertung, Account_ hanneswobus. Wie man am Layout des Reports unschwer erkennen kann, arbeite ich noch an dem Layout und an der endgültigen Fassung.

Beide Datensätze werden ab sofort in die Reportingdienstleistung aufgenommen.

Accountanalyse (Instagram) – Update 0.2Beta

Die Analyseprozedur wurde nun um die Ausgabe der Verläufe erweitert.
Das Beispieldiagram zeigt den Verlauf eines betreuten Klienten aus dem Bereich „Tourismus“.
[Beispiel]


In den nächsten Versionen und nach der Erhebung weiterer Datensätze ist die Etablierung konkreter Metriken geplant. Im Moment denken wir über die Zahlen:
Verhältnis „Likes“ zu „Posts“
[Ergebnis]=Summe_Likes*(Summe_Posts/100)
und
Verhältnis „Comments“ zu „Posts“
[Ergebnis]=Summe_Comments*(Summe_Posts/100)
nach und werden die Reports im Sinne der Accountvergleichbarkeit anpassen.

Rohdaten: Accountanalyse (Instagram)

Die Datenerhebung für die angekündigte Accountanalyse-Anwendung ist nun soweit fertig und in der aktuellen Version gehe ich wie folgt vor:

[Erfassen der Account-ID]
– via API
– via „lookup your instagram user id

[Erfassen der hinterlegten Daten]
(1) Ansprache der API
$api = „https://api.instagram.com/v1/users/[ID]/media/recent/?access_token=[TOKEN]“;
$response = get_curl($api);

(2) Auswertung und Auslesen der Datensätze
if($response){
foreach(json_decode($response)->data as $item){
$url = $item->link;
$zeitstempel = $item->created_time;
$comment = $item->comments->count;
$gefaellt = $item->likes->count;
$id_code = $item->id;
$schlagworte = $item->tags;
$comma_separated = implode(“ „, $schlagworte);
echo $url.“|“.gmdate(„Y-m-d“, $zeitstempel).“|“.$comment.“|“.$gefaellt.“|“.$id_code.“|“.$comma_separated;
}

Wir hatten im Zuge der Entwicklungsarbeiten auch intensiv über eine Backupfunktion oder eine Massdownloadfunktion bzgl. der geposteten Fotos diskutiert und letztendlich entsprechende Features (vorerst) verworfen, da die bekannte Instagram-App bearbeitete Fotos auf den Geräten speichert.
Die Angabe „zeitstempel“ bleibt vorerst auf die Ausgabe von „Datum“ beschränkt und ich behalte mir eine Erweiterung auf „Zeit“, „Uhrzeit“ zzgl. „Minuten“ vor.

Für die weitere Analyse verwende ich die Angabe „id_code“ und die folgenden Endpoints:
(a) Liste: Likes
https://api.instagram.com/v1/media/[ID]/likes?access_token=[TOKEN]
– gibt die likende Accounts zur hinterlegten Media-ID aus

(b) Liste: Kommentare
https://api.instagram.com/v1/media/[ID]/comments?access_token=[TOKEN]
– gibt die kommentierenden Accounts zzgl. der (!) Kommentare zur hinterlegten Media-ID aus

Die Erfassung der o.g. „Rohdaten“ funktioniert recht stabil und weitestgehend fehlerfrei. Ausgehend hiervon ergeben sich nun Antworten auf die folgenden Fragen:

  1. Welche Posts werden am häufigsten frequentiert (sichtbar durch Likes und Kommentare)?
  2. Welche Hashtags generieren das effektivste Like / Kommentar-Verhältnis?
  3. Welche Postingzeiten sind effektiv? (sichtbar durch die Ergebnisse von (1) und (2)
  4. Wer mag diese oder jene Fotos gepaart mit konkreten Botschaften (Tags) (bezogen auf den eigenen oder fremde Accounts)?
  5. Woher kommen die Fans (eigener Account, fremder Account)?
  6. Wie aktiv und treu sind die Fans?

Die Fertigstellung einer ersten Version ist für 21.02.2016 geplant.