Datenfreigabe 3_3: Hashtagdatenbank (Quelle: Instagram – API)

URL: https://www.pontipix.de/datenbank_downloads/hashtagdb_main.zip 

(Hinweis: gepackt ca. 13GB, entpackt ca. 40GB)

Die DB-Tabelle beinhaltet folgende Spalten:

ID, Tag (Hashtag), Haeufung, Datum

Zur Erläuterung:

ID und Tag / Hashtag sind selbsterklärend. Die Häufung ist die ausgelesene Gesamtanzahl aller Postings unterhalb des Hashtags zum jeweiligen Datum. 

#1 Basisabfragen

(a) Abfrage -> Anzahl: Datensätze

select count(*) from tags;

Ergebnis: 949.781.647

(b) Abfrage -> Anzahl: Datensätze / 2016

select count(*) from tags where datum like ‚%.2016%‘;

Ergebnis: 33.876.572

(c) Abfrage -> Alle Zeitstempel

select distinct datum from tags;

Ergebnis: 423, verteilt auf 2016, 2017, 2018

#2 Inhaltliche Abfragen

(a) Substrings

select * from tags where tag like ‚%leipzig%‘;

(b) Strings

select * from tags where tag = ‚berlin‘;

Für das Auslesen u. ggf. Interpretieren benötigt man eine geeignete Software (SQLite-Studio, Knime etc.). Die Datensätze sind aus 2016 bis 2018 und dienten während der Erhebung für Contentmarketingrecherchen und andere Aufgaben.

Datenfreigabe 2_3 (Quelle: Postingelemente aus Instagram in Verbindung mit Locations)

URL: https://www.pontipix.de/datenbank_downloads/instaloc_clean.zip 

Hinweis (1): 

Die Datenbank ist gepackt 13GB und entpackt 41GB.

Sie umfasst nur einen Teil unseres Datenbestands und ich gab hier eine zufällig ausgewählte Datenmenge je erfassten Länder frei. Technisch wurde der Datenübertrag über einen Zufallsgenerator gelöst, wobei hier kein Themenschwerpunkt gesetzt wurde. 

Die Freigabe erfolgte unter der Bedingung: die Datenbank darf ausschließlich für Weiterbildung- u. Ausbildungszwecke genutzt werden und bei Publikation erwarte ich selbstverständlich eine Namensnennung inkl. Link auf https://www.pontipix.de/.

Hinweis (2):

Die Datenquelle ist Instagram via Instagram-API in der jeweils gültigen Fassung unter Beachtung der jeweils aktiven Richtlinien. 

Die DB-Tabelle beinhaltet folgende Spalten:

id, url, tags, likes, comments, erstellzeit, contentinfo, country, country_code, city, county, state_district, suburb, city_district, pub, cafe, hotel, college, town_hall, florist, arts_centre, public_building, hospital, sport_centre, swimming_pool, travel_agency, community_centre, playground, clinic, books, pedestrian, chemist, car_wash, fort, golf_course, theme_park, water, castle, picnic_site, pharmacy, fast_food, track, garden, locality, residental, adress29, wood, retail, town, industrial, cycleway, village, guest_house, artwork, bus_stop, bar, bakery, fuel, zoo, car, university, neigbourhood, viewpoint, bank, stadium, hairdresser, place_of_worship, beach, mall, school, memorial, attraction, supermarket, footway, restaurant, theatre, parking, clothes, hamlet, raceway, aerodome, library, museum, commercial, ruins, building, PLZ, road

#1 Abfragebeispiele -> Bezug auf Land / Stadt etc. 

select * from locations where country_code = ‚de‘; 

select * from locations where country_code = ‚de‘ and city = ‚Berlin‘; 

select * from locations where country_code = ‚de‘ and city = ‚München‘; 

select * from locations where country_code = ‚de‘ and state = ‚Sachsen‘; 

select distinct country_code from locations;

select distinct city from locations where country_code = ‚de‘;

#2 Abfagebeispiele -> Bezug auf Locationtypen

select * from locations where country_code = ‚de‘ and restaurant <> “; 

select * from locations where country_code = ‚fr‘ and restaurant <> “

select * from locations where country_code = ‚us‘ and school <> “; 

#3 Abfragebeispiele -> Bezug auf Inhalte

select * from locations where country_code = ‚de‘ and school <> “ and contentinfo like ‚%1 person%‘

select * from locations where country_code = ‚de‘ and contentinfo like ‚%1 person%‘

select distinct(contentinfo) from locations where country_code = ‚de‘;

select distinct(tags) from locations where country_code = ‚de‘ and city = ‚Leipzig‘;

Weitere Abfragevarianten ergeben sich aus der Tabellenstruktur, den Spalten und der konkreten Fragestellung. Denkbar sind Verbindungen zwischen Tags, Taggruppen, den Bildinhalten („Contentinfo“) und konkreten Ländern. 

Datenfreigabe 1_3 (Quelle: Instagram-Locations mit Openstreetmap)

URL: https://www.pontipix.de/datenbank_downloads/locplain_big.zip

Hinweis (1): 

Die Datenbank ist gepackt 338MB und entpackt 818MB.

Die Freigabe erfolgte unter der Bedingung: die Datenbank darf ausschließlich für Weiterbildung- u. Ausbildungszwecke genutzt werden und bei Publikation erwarte ich selbstverständlich eine Namensnennung inkl. Link auf https://www.pontipix.de/.

Hinweis (2):

Die Haupt-Datenquelle ist Instagram via Instagram-API in der jeweils gültigen Fassung unter Beachtung der jeweils aktiven Richtlinien. 

Die DB-Tabelle beinhaltet folgende Spalten:

id, locations, lat, long, country, country_code, city, county, state_district, suburb, city_district, pub, cafe, hotel, college, town_hall, florist, arts_centre, public_building, hospital, sport_centre, swimming_pool, travel_agency, community_centre, playground, clinic, books, pedestrian, chemist, car_wash, fort, golf_course, theme_park, water, castle, picnic_site, pharmacy, fast_food, track, garden, locality, residental, adress29, wood, retail, town, industrial, cycleway, village, guest_house, artwork, bus_stop, bar, bakery, fuel, zoo, car, university, neigbourhood, viewpoint, bank, stadium, hairdresser, place_of_worship, beach, mall, school, memorial, attraction, supermarket, footway, restaurant, theatre, parking, clothes, hamlet, raceway, aerodome, library, museum, commercial, ruins, building, PLZ, road

#1 Abfragebeispiele -> Bezug auf Land / Stadt etc. 

select * from locations where country_code = ‚de‘; 

select * from locations where country_code = ‚de‘ and city = ‚Berlin‘; 

select * from locations where country_code = ‚de‘ and city = ‚München‘; 

select * from locations where country_code = ‚de‘ and state = ‚Sachsen‘; 

select distinct country_code from locations;

select distinct city from locations where country_code = ‚de‘;

#2 Abfagebeispiele -> Bezug auf Locationtypen

select * from locations where country_code = ‚de‘ and restaurant <> “; 

select * from locations where country_code = ‚fr‘ and restaurant <> “

select * from locations where country_code = ‚us‘ and school <> “; 

Weitere Abfragevarianten ergeben sich aus der Tabellenstruktur, den Spalten und der konkreten Fragestellung.

Freundschaftsaufragen / Kontaktanfragen auf LinkedIN – auch bekannt unter „Facebook 2.0“

Mir fällt auf, dass eine sportliche Menge an PersonalBranding-Genies bei mir anklopfen u. sagen „Lieber Johannes Wobus, werde BITTE mein virtueller LI-Freund (Netzwerkanfrage)!“ u. ich verstehe da etwas nicht.

Es _ist_ bekannt, dass ich enorm speziell werden kann, wenn ich folgende Dinge sehe:

(1) „Ich bin geil“ – Beiträge, mit CTAs, die mich an „Schatz, war es auch so geil für Dich?“ – Fragen erinnert.
(2) Völlig uninteressante Selfis.
(3) Irgendwelche Fotos von Haustieren mit simulierter pers. Nähe
(4) Tipps u. Tricks, die letztendlich auf Bespammen der Plattform via Commentspamming hinauslaufen
(5) Jammerstories rund um Haten u. Bashen
(6) Seltsame Wortsammlungen rund um Digitalisierungen ohne jegliche Substanz u. erkennbare Expertise
(7) EgoSchau u. gezieltes Züchten von Beifallklatschenden.

WARUM sollte ICH hier eine Freundschaftsanfrage annehmen? Das sollte man sich fragen, wenn man aus der Ecke kommt, bereits Spaß mit mir hatte u. hier einen Kontakt wünscht.

Es gibt aber eine spezielle Ausnahme, wo ich neugierig werde u. das ist eine geldwerte Anfrage ODER die Darbietung eines hochkomplexen Diskussionswunsches rund um Daten, Bigdata, MaFo, Programmieren, Datenschutz, Datensicherheit, SocialMedia u. deren Rolle für Wirtschaft, Gesellschaft u. Kultur. DANN ignoriere ich meine Befindlichkeiten, die ich gegenüber der „Szene“ pflege u. ich habe das genau 3 mal gemacht u. war / bin äußert zufrieden mit den Ergebnissen u. den Kontakten.

Aus dem Archiv: der Podcast mit Puyan

Ich muss gestehen: JA- ich bin eitel u. suche regelmäßig nach Spuren, die mit meinem Namen verbunden sind. Da tauchte tatsächlich Puyans Podcast „Umgang mit Big Data im Marketing [Moral & Ethik] | Puyan’s Podcast #10 mit Johannes Wobus“ auf.

Der junge Mann begeisterte mich durch seine Intelligenz, Innovation u. erinnerte mich irgendwie auch an meine „Anfangszeit“. Das bedeutet auch: ich wurde offener, direkter u. gab etwas mehr Inhalte „zum Besten“.

Aus dem Archiv. Das Interview mit dem zauberhaften Engin Eser

Engin sprach mich – wie viele Andere auch – irgendwann einmal auf LinkedIn an, weil ich mich immer für ein besseres Verständnis und mehr Kompetenz im Bereich der IT einsetze, sofern man tatsächlich den Sprung in das Haifischbecken „Onlinemarketing“ wagt.

Ihm gefiel wohl meine direkte Art und daraus entstand die Idee, sich einmal live („Offen, ehrlich, direkt Ben Schulz & Johannes Wobus zu Coachings, digitalen Transformation & New Work“) zu unterhalten.

„LateNightLinkedin meets Johannes Wobus – Datenspuren im Internet“

Ich bin schon relativ lange auf Linkedin aktiv und wer mich kennt, wird sicherlich wissen, dass ich sehr lange, hart und intensiv diskutieren kann: speziell in den Gebieten der Daten, Algorithmen und deren Verbindungen mit Marketingaspekten / Marketingstrategien.

Irgendwann entdeckte ich den Brent und wir stritten uns, wir führten Dispute und irgendwann rief der hier an und fragte mich „Darf ich ein Interview mit Dir führen?“. Wir redeten ein wenig u. man spiegelte mir „DU BIST JA NETT!“. Hahaha.

Ja. Ich bin nett! (Insiderwitz).

Hier der Link zu dem Interview.

https://www.youtube.com/watch?v=of3kLzT-uIc

Made to Measure // Filmprojekt

Das Kunstwerk ist extrem gut umgesetzt, sehr logisch aufgebaut u. irgendwie habe ich die Hoffnung, dass das Werk bspw. in medienpäd. Schulungen eingesetzt wird.

Es gibt da ein paar Szenen, die triggern können u. hoffe, dass das Ergebnis zu einer immer stärker werdenden Sensibilisierung bei den Werbeopfern führt, dass man sich Gedanken macht, welche Daten da im Spiel sind, dass man hierüber diskutiert u. ggf. sogar anfängt, sich u. sein Verhalten zu hinterfragen.

Viel Spaß mit dem Film / interaktiven Experiment.

Achja: mein Gesicht taucht da irgendwo auf. :-)

Interaktiver Film
https://www.madetomeasure.online/de/

Trailer
https://www.youtube.com/watch?v=ysWp7elT_Dg

Mediathek
https://www.ardmediathek.de/video/wdr-dok/made-to-measure-eine-digitale-spurensuche/wdr-fernsehen/Y3JpZDovL3dkci5kZS9CZWl0cmFnLWYwZGQwNTgwLWMyNDUtNGIwZC1iNjE5LTljY2YwNDM5NmVhMQ/?xtor=CS1=230

Produktentwicklungen // Brainstorming (1)

An der Stelle: ein dickes, fettes und hochemotionales DANKESCHÖN an die vielen netten Menschen aus dem Netzwerk (privat + beruflich), die mir immer wieder Rückmeldungen zu den Datensammlungen u. den Ableitbarkeiten von Erkenntnissen geben u. gegeben haben.

Wir sind jetzt so weit, dass mit einem professionellen u. sauberen Grundgefühl erste Diskussionen zu Produkten geführt werden können. Aus der Datenquelle Twitter wurden 300.000 öffentliche und werbende Accounts ausgelesen, welche im Reportformat folgende Daten zeigen:

  • Accountbeschreibung
  • Location -> Accountregistrierung
  • Zeitstempel -> Accountregistrierung
  • Metriken: Likes, Fans, Listen
  • themenrelevante Beiordnung von Touchpoints auf Basis abgesetzter Tweets nach Vorfilterung

Auf Basis der Reports lassen sich saubere Strategieberatungen ableiten und typische Anwendungsszenarien sind:

  • Kontaktakquise für PR
  • Marktbeobachtungen: Trends, Konkurrenz

Wir sind hier in einer Preisfindungsdiskussion und werden zeitnah in die Pitches gehen.

Socialmedia und das Spiel mit den Reichweiten

Mittlerweile gehört es zum Standard, dass ich mir den (Online)Markt anschaue und den via Gegenlesen der vielen Theorien und Texte seitens der Marktbespielenden auf Linkedin prüfe.

Irgendwie läuft derzeit eine interessante Eigenmarketingwelle mit Fokus der Organisation von Reichweiten auf den Plattformen. Hier fällt mir eine Theorie auf:

Follower haben nichts mit Reichweite zu tun und alle Kolleg:innen, die Gegenteiliges behaupten, sind wahlweise dumm, inkompetent und sollten definitiv niemals gebucht werden!

Selbstverständlich wurde diese Theorie im Stil eines Fachartikels präsentiert und dazu gehörten auch entsprechende Stilelemente, wie bunte Bilder und eine Gliederung, welche mich an eine Semesterarbeit erinnert.

Das Problem bei der Geschichte ist nur, dass konkrete Analyse fehlen. Man muss sich bei der Begutachtung der Follower vs. Reichweiten vs. Monitarisierungsdiskussion nämlich durchaus folgende Fragen stellen (lassen):

  • Wie kann man von Extern die Interna eines Accounts sichten (also ohne Zugriffe auf Logindaten)?
  • Wie genau kann man von Extern die Kommunikation aus PM/DM der Accounts sichten?
  • Wie genau kann man prüfen, ob ein Follower ein tatsächlicher Kunde ist, war oder werden wird?
  • Welche konkreten Studien / Analysen / Whatever hat man selbst inkl. Datenerhebung durchgeführt, welche gefühlt „gerichtsfest“ zur Beweisführung dienen können?
  • Wie genau wurde nachgeprüft, welche Follower zu welchem Zeitpunkt da interagierten (Likes + Comments)?

Mir fallen noch einige weitere Fragestellungen ein und ich finde den Streit mit dem Markt amüsant. Ich finde das sehr gut, ich mag das und ich sehe darin auch eine Möglichkeit der persönlichen und geschäftlichen Weiterentwicklung. Gehe ich allerdings in diesen Streit hinein, muss ich zwingend notwendig genauestens wissen, was ich da mache, was ich da argumentiere und welche Fallstricke meine (!) Argumentation zeigen.

Sprich: ich muss mit Gegenrede rechnen u. ich muss damit rechnen, dass ein Angriff auf Theorie XYZ eben immer bedeutet, dass ich diesen Angriff belegen können MUSS.

Was bin ich, wenn ich das nicht kann? Was bin ich, wenn ich bspw. den Wettbewerb basislos angreife?

  • Unfassbar kompetent.
  • Ein Genie, ein Influencer.
  • Eine Autorität.
  • Ein inkompetenter Wichtigtuer.

Sucht es Euch aus u. – nein – das ist kein Werbetext.