Datenvisualisierung und Start der KNIME-Reihe

Im letzten Jahr fand ich endlich Gelegenheit zur Sichtung diverser Datenmanagement- und Datenauswertungsansätze, weil ich ab einem gewissen Punkt mit meiner Programmierkunst via Delphi viele Szenarien nicht abdecken kann.

So landete ich bei KNIME und fand einen guten Weg, die Workflows zu verstehen und in das Tagesgeschäft einbauen zu können. Interessant ist, dass dieses mächtige und sehr umfangreiche System gefühlt problemlos bspw. die 85GB umfassende Twitterdatenbank oder die 46GB starke InstagramDE/CH/AT-Datenbank andocken, bearbeiten und für diverse Dataminingszenarien ansprechen kann.

Galerie zeigt 2 Screenshots, welche Terms / Keywords aus den Meinungsbekundungen von ~3.8Mio DE-schreibenden Accounts (Twitter) mit Filter auf Covid19/Pandemie/Coronavirus (Themencluster).

Der „Trick“ ist eigentlich recht simpel: sofern die Datenerfassungsprozedur stabil funktioniert und die Datenbank ordentliche Standards (Technik, Struktur etc.) zeigt, wird via KNIME-Workflow eine Analysemechanik auf die Tweets quasi „angesetzt“. Diese zerlegt den Content in Einzelworte, gewichtet diesen mittels einer Prozedur, welche folgende Metriken beinhaltet:

  • Interaktionen
  • Zeitstempel
  • Anzahl: aktiver Accounts mit Themenfilter

Über diesen Gewichtungsschritt sind Themenzusammenhänge der UnterCluster visualisierbar und das erste Bild der Galerie demonstriert die Zusammenfassung der Themenwolken in Filterblasenstrukturen.

Statusupdate und Start in das 2021er

Ich schaue gerade in das Blog und stelle fest, dass ich mich ein Jahr lang nicht mehr um neue Inhalte kümmerte.

Oh mein Gott, die Welt geht unter und weil viele Marketinggurus auf LinkedIn immer wieder betonen, wie wichtig denn die Contentproduktion sei, gelobe ich hiermit Besserung! :-)

Was gibt es Neues bei uns?

Achja. Anne hat geheiratet und deswegen sind wir nicht mehr die Wobus & Lehmann GbR, sondern die Wobus & Wächter GbR. Mir gefällt dieser Namenswechsel!

Dann hatten wir im letzten Jahr nahezu in Vollzeit diverse Projekte mit und um die TEAL AG rund um die Themenwelten Bigdata und KI aufgesetzt und gestemmt. Das Engagement lief zum 31.12.2000 aus und eines der interessanten „Learnings“ für mich ist das tiefergehende Verständnis für gewaltige Datenbanken, deren Auslesen und das Interpretieren von Abfrageergebnissen mit diversen Tools, wie eben KNIME. Zu KNIME werde ich mich von Zeit zu Zeit auf diesem Blog äußern.

Es gab auch einen Wechsel in den Datenbanken und Datenquellen. Mir ist ein stabiler Zugang zu Instagram, obwohl es starke Veränderungen gab, gelungen und in den Analyseprozeduren befinden sich jetzt auch – tataaaa- Twitter, Weibo und Reddit.

Tensorboard: Start (Notiz)

An der Stelle muss ich gestehen, dass ich heute zum ersten Mal das Programm gesehen habe und relativ viele unlogische Fehler rund um den Startvorgang sichtbar wurden.

Tensorboard liess sich bei mir via Neuinstallation von Anaconda + Neuinstallation mit „conda install -c conda-forge tensorflow“ reparieren.

Der Start läuft über die CMD-Eingabe „tensorboard –logdir=path/to/log-directory“ und die URL lautet: http://localhost:6006/

Twitter: Start eines Experimentes und erste Zahlen

Nach einigen Gesprächen und diversen Diskussionen entschied ich mich zur Freigabe eines spezielleren Accounts zwecks Analyse der Fragen:
– Wie funktioniert das Ding mit Twitter eigentlich?
– Wie lassen sich bei Twitter mit welchem Aufwand (!) Autoritäten etablieren?
– Wie funktioniert bei Twitter die Statistik und die Auswertung der systemeigenen Statistik?
– Wie funktioniert bei Twitter die Verwertung der Hashtags?

Hier nun der erste Zahlenstand mit (Re)etablierung des Accounts.

Der Account bedient folgende Themen / Inhalte:
– Momentaufnahmen, Schnappschüsse (Digital, div. Rundreisen und sonstige Motive)
– Neu: Analogfotografie und Dokumentation der „Experimente“ mit div. Materialien, Farben und Motive
– Retweets: überwiegend S/W, monochrome
– Grundbefüllung via IFTTT vom Instagramaccount ausgehend

Die aktuellen Zahlen und auch Rückmeldungen via Twitter-Kontakte sind soweit überraschend gut und ich werde zeitnah analysieren, wie sich der Beziehungsaufbau bei dem System effektiver organisieren lassen kann.

Fragen, Austauschanregungen und Kontakt bitte via bekannten Telefonnummern (siehe Impressum)