Am Beispiel zweier kommunikationswissenschaftlich relevanter Datensätze überprüft und validiert die Arbeit einen zentralen Schritt der Datenfusion im Rahmen des topologischen Ansatzes nach Wendt (1976) in verschiedenen Vorgehensweisen.
Bei einer Fusion (Statistical Matching) werden spezifische Personenmerkmale (z.B. Mediennutzung) aus einem Spender-Datensatz soziodemographisch ähnlichen Personen eines Empfänger-Datensatzes zugewiesen. Um die Ähnlichkeit zwischen Spender und Empfänger ermitteln zu können, müssen in beiden Datensätzen die gleichen soziodemographischen Merkmale erfasst worden sein. Der Empfänger-Datensatz, eine Vorwahlstudie zur Bundestagswahl 1994 (ZA 2599), wie auch der Spender-Datensatz, die Media-Analyse 1994, entsprachen den Gütekriterien der Datenfusion und dienten als Grundlage für die Merkmalsübertragung.
Die Magisterarbeit dokumentiert im Rahmen eines Forschungsprojektes des Erstgutachters den im topologischen Ansatz wichtigen Schritt der Segmentierung mittels Clusteranalyse (Basis: soziodemographische Merkmale) im Spender-Datensatz sowie die Rekonstruktion der Clusterzugehörigkeit im Empfänger-Datensatz. Diese Rekonstruktion wird in verschiedenen Varianten bzw. Algorithmen durchgeführt und anschließend in mehreren Schritten validiert. Es zeigt sich, dass die durchgeführten Varianten jeweils Vor- als auch Nachteile haben, welche sich bei der Anwendung entsprechend im Ergebnis niederschlagen.
Datenfusion bei Sekundäranalysen
Intern erhobene und extern zugewiesene Mediennutzungsdaten am Beispiel von Politbarometer und Media-Analyse