Wir haben uns daran gewöhnt, dass Google ein gefährlicher Datenkrake und Apple ein nimmersatter Verkäufer digitaler Spielzeuge ist. Diese Archetypen der digitalen Ökonomie haben mittlerweile sogar schon einen Urahn: Der Großvater Microsoft röchelt noch ein wenig auf dem Sofa des weltweiten Datennetzes vor sich hin. Aber auch dieser Methusalem hatte einst richtige Feinde. Vor 10 Jahren hatten Legionen von Journalisten vor den Konsequenzen der digitalisierten Arbeitswelt gewarnt. Die Menschen wurden krank vor schlechten Monitoren und Bürostühle genügten nicht mehr den ergonomischen Anforderungen. Vor allem der Aufbau der Oberfläche von Microsofts Bürolösungen galt als steinzeitlich. Heute ist das alles vergessen. Seit wir den Monitor auf ein Zehntel verkleinert haben und darauf herumwischen, geht es uns so gut, dass die wahren Gefahren nur noch von den Datenbanken der Werbenetzwerke ausgehen. ZEIT und Süddeutsche Zeitung hatten Mitte der Woche berichtet, dass die kapitalistische Großinvasion namens Google ihre giftigen Arme auf uns gerichtet habe. In einer Datenbank mit dem mysteriösen Kürzel DDP sollten die Interessen der Werbekunden an den Meistbietenden verhökert werden. Der Datenschutz – die goldenen Bulle der letzten Jahre – war in Gefahr. Offenbar hatte Google vor, uns alle zu verwanzen… Man schrieb von der Website des amerikanischen Marketing-Fachblatts AdAge ab. Zumindest glaubte man, den Artikel dort verstanden zu haben. Dort wurde eine neue Lösung der Googlianer für das Target-Markting von Bannerwerbung auf Websites vorgestellt. Das Ziel bei dieser Form der Werbung liegt darin, den älteren Semestern im Internet Werbung für Kreuzfahrten auf den Leib zu schneidern und dem siebzehnjährigen Enkel die neueste CD seiner Lieblingsband zu präsentieren. Die Süddeutsche zog ihre Schlüsse etwas voreilig:“Künftig sollen Werber bei Google Daten von Verbrauchern kaufen können, mit Name, Adresse und, vor allem, nach Interessen sortiert.“ Google hat solche Adressen in den allermeisten Fällen vermutlich gar nicht. Und wenn sie die hätten, wäre es das Ende des Werbegeschäfts, wenn sie sie verkauften. Das Vertrauen wäre dahin – weltweit. Im Gegenteil sind es nicht selten dessen Kunden, die Online-Shops und Versandhändler, die ein einträgliches Geschäft mit der Vermietung von Adressen betreiben. In Wirklichkeit geht es bei Googles Plattform namens AdExchange um die Werbeplätze auf einer Website, auf denen die sogenannten Banner erscheinen, die uns so freundlich blinkend den letzten Nerv rauben, wenn wir einen Artikel in einem Online-Magazin verstehen wollen. Das Dementi von Google kam dann auch kurze Zeit später auf Google+, dem sozialen Netzwerk des Werbemonopolisten: „Wir verkaufen keine Nutzerdaten oder -profile und werden das auch in Zukunft nicht tun. Richtig ist, dass wir zusammen mit anderen Werbenetzwerken an Initiativen arbeiten, das Datenmanagement von Interessenskategorien zu vereinfachen, indem die vorhandenen Daten aus verschiedenen Werbenetzwerken auf einer Plattform zusammengefasst werden.“ Man will dort sogar dem Nutzer ermöglichen, aus der personalisierten Werbung anhand von Interessensgebieten auszusteigen. Genau dieser Datenbank gegenüber soll der Nutzer dann erklären können, dass er keine persönliche maßgeschneiderte Werbung haben will. Ein totales Aus der Werbung hätte fatale Folgen. Denn das würde automatisch zur Folge haben, dass 90% aller professionellen Webangebote Abonnementkosten erheben müssten. So gesehen ist eine personalisierte Werbung das kleinere Übel. Und es ist für viele junge Männer eine gute Entwicklung, dass im Web keine Werbung mehr für Damenbinden, Treppenlifte und ausgefallene Hüte um ihre Aufmerksamkeit buhlt. Frauen verzichten dafür gern auf hübsche Bildchen über Rasierschaum, Sportwagen und Tennissocken. Aber die Alarmglocken vieler Journalisten klingeln häufig, wenn die digitale Trias aus Google, Werbung und Nutzer eine neue Verknüpfung erlebt. Dass sich viele Firmen viel lieber bei den fein justierbaren Datenbanken von Facebook bedienen, scheint noch nicht so ganz bis in die heiligen Hallen der Recherche gedrungen zu sein. So wird Facebook immer mehr zum McDonalds der Sozialen Netzwerke. Die Flut an sinnlosen Spielen und unerwünschter Werbung nimmt dort epische Ausmaße an. Aber man verdient noch immer nur einen Bruchteil des Suchmaschinenmonopols. Google will alles. Wer Mitglied im neuen Netzwerk ist, der wird feststellen, dass alle je verfügbaren Dienste nun ein Dach bekommen haben. Das gemeinsame Erstellen von Dokumenten im Web, das Verwalten von Fotos und viele andere Dienste, die wir mit unserem Computer täglich verrichten, bietet Google im Rahmen seiner Cloud-Services an. Das bedeutet, dass man eigentlich keine Festplatte mehr braucht, weil alle Daten irgendwo auf einer der Serverfarmen von Google liegen. Konsequenterweise bietet man seit diesem Sommer dafür sogar eigene Laptops an. Diese Chromebooks genannten mobilen PCs kommen ganz ohne Windows oder Linux als Betriebssystem aus. Was für uns sinnlos erscheint, ist für die neue Generation der digitalen Konsumenten schon eingeprägt: Computer ohne Internet sind wie Licht ohne Strom. Ob der röchelnde Senior namens Microsoft dem noch irgendetwas entgegenzusetzen hat? Einige größere europäische Verlage haben ihre Zusammenarbeit bereits in die virtuellen Arbeitsräume von Google Docs verlegt. Dort hat man sehr still gehalten, als die Google-Suada durch den deutschen Blätterwald zog. Vielleicht stürzten dort aber auch immer die virtuellen Dokumente ab, als die Redakteurinnen etwas Schlechtes über den Suchgiganten schreiben wollten?
Lifestream » suche
Navigation in Daten: Vom Suchen und Finden
http://feedproxy.google.com/~r/blogpiloten/~3/EaiStJW1Ke0/
Kanonische Wissensbestände müssen durch intelligente Suchroutinen ersetzt werden. Diese Weisheit gilt nicht erst im digitalen Zeitalter, sondern hat auch schon die Archivare und Intellektuellen der Prä-IT-Ära geprägt. Eine Spurensuche bei Leibniz, Eco und Herder…
Die Klage über Datenfluten, Neurostress und technologische Überforderung ist kein Phänomen des Internetzeitalters und der mobilen Arbeitswelt, meint Peter B. Záboji, Chairman des After-Sales-Spezialisten Bitronic. Man müsse wie früher genau selektieren, welche Informationen durchkommen dürfen und welche nicht. „Beim traditionellen Briefverkehr waren es die Vorzimmer im Unternehmen, die eine Auswahl vorgenommen haben. Heute sind es elektronische Filter und virtuelle Assistenzsysteme. Man sollte die Technik nur geschickt einsetzen und darf sich nicht von ihr dominieren lassen.“ Die Folgen der informationellen Unzulänglichkeit des Menschen habe der Informatiker Professor Karl Steinbuch vor über 30 Jahren treffend beschrieben. Ein Wissenschaftler stehe beispielsweise ständig vor dem Dilemma, ob er seine Zeit der Forschung widmen soll oder der Suche nach Ergebnissen, die andere schon gefunden haben. Versuche er, fremde Publikationen erschöpfend auszuwerten, dann bleibe ihm kaum Zeit zu eigener Forschung. Forsche der Wissenschaftler jedoch ohne Beachtung fremder Ergebnisse, dann arbeitet er möglicherweise an Erkenntnissen, die andere schon gefunden haben. „Mit den Recherchemöglichkeiten, die das Internet heute bietet, reduziert sich allerdings der Aufwand für das erste Szenario erheblich“, sagt Záboji. Die Jagd wirkt anregend Aber auch mit Kombinatorik kann man sich aus der Datenflut befreien. Das bewies Gottfried Wilhelm Leibniz als Bibliothekar der berühmten Barockbibliothek in Wolfenbüttel. Er erwandert die Werke ohne Katalog. Auf ausgedehnten Spaziergängen und zufälligen Bahnungen durch die Säle und Kabinette der Bibliothek findet er vergessene und unvermutete Bücher. Er entdeckt mit Zufallsverfahren im unüberschaubaren Fundus jene außergewöhnlichen Schriften, um deren Aushebung ihn die Fachwelt noch heute lobt. Ohne ein helfendes Register, ohne extra erstellte Übersichten zur Hand zu nehmen, geraten seine Funde zum Produkt eines zufallsgesteuerten Zugriffs. Die Büchersammlung wandelt sich zu einem Depot für neue Gedanken und Ideen. Und selbst die Jagd nach Büchern wirkt anregend und erweitert den Horizont. So durchwandern die Schriftsteller Nooteboom und Eco die verborgenen Schatzkammern von Amsterdam, darunter Antiquariate, die sich auf Okkultismus, Alchimie und Gnosis spezialisiert haben. „Wir gingen zuerst in das Antiquariat, in dem ich früher am meisten gekauft hatte. Es gehört Nico Israel und ist auf Kartografie, Manuskripte und Naturwissenschaften spezialisiert; sein Bruder Max, den Eco bereits aus eigenem Forscherdrang entdeckt hatte, führt Wissenschaft, Medizin und Kunst. Dieser Nachmittag ist für mich eine kostbare Erinnerung geblieben, zum einen, weil ich nach so langer Zeit wieder diese heiligen Hallen besuchte, und dann, weil Eco, unermüdlich, ständig zum Lachen bereit, mit seiner Stentorstimme und seinem starken italienischen Akzent stets den Kern der Sache traf“, so die Abhandlung von Nooteboom „In Ecos Labyrinth“, erschienen in „Nootebooms Hotel“. Ertränkt von Wissen Ob nun eine Vorauswahl in Bibliotheken getroffen und Bestände ordentlich katalogisiert werden oder nicht, für Gottfried Herder stellt sich im 18. Jahrhundert die Frage, wie man eine ganze Bibliothek und das gesamte Weltwissen lesen kann. Zum Zeitpunkt seiner Abreise aus Riga zu einer langen Seefahrt ist Herder gerade einmal 24 Jahre alt. „Er beklagt sein Gelehrtenschicksal und sieht sich geradezu ertränkt von Büchern. Er sei ‚ein Wörterbuch von Künsten und Wissenschaften‘. Herder beschreibt sich als trockenen Gelehrten, als ein totes, künstliches System von Wissensbeständen. Er selbst sei ‚ein Tintenfass von gelehrter Schriftstellerei‘. Mit 24 ist Herder so angefüllt von Wissen, dass er dieses als Ballast beklagt“, so Matthias Bickenbach und Harun Maye in ihrer Abhandlung „Metapher Internet – Literarische Bildung und Surfen“, im Kadmos Verlag erschienen. Was Herder mit seinem privaten Archiv erlebe, ist im Kleinen das, was im Fall des gelehrten Wissens in der zweiten Hälfte des 18. Jahrhunderts zum generellen Problem wird: der Buchmarkt als Massenmarkt. Die Bibliotheka universalis von Gessner sei zwar komplex und umfangreich, eine Kombination und Quervernetzung von Sachgebieten werde nicht ermöglicht. Eine Suche, die nicht bereits weiß, in welches Gebiet der akademischen Klassifikation das Gesuchte gehöre, hat keine Aussicht auf Erfolg. Die Unzulänglichkeit der Kataloge ist ein Bibliotheksproblem. Das Auffinden der Bücher war weitgehend auf den Gesamtüberblick des Bibliothekars, auf sein persönliches Gedächtnis angewiesen. Es gab weder eine Lösung, um Neueingänge schnell eingliedern zu können, noch wusste man, wie Misch- und Sammelbände zu klassifizieren oder wie Zeitschriftenbeiträge bibliografisch festzuhalten waren. „Deutlich wird, dass eine Bibliothek zu stark auf die Ordnung des Wissens Einfluss nimmt, Innovationen erschwert oder unmöglich macht“, führen Bickenbach und Maye aus. Die Suchläufe kennen keinen Abschluss Herder entwickelt in seinem Reisejournal die Kulturtechnik der kursorischen Lektüre. Er wird zum Läufer, zum Cursor, der im virtuellen Raum der Gelehrtenbibliothek zwischen Texten durcheilt und in dieser schnellen Bewegung neue Querverbindungen schafft. Es sei ein methodisches Verfahren, das ihm die Lizenz zum Flüchtigen gibt. In der sogenannten „percursio“ – im Durchlauf – darf aufgezählt und angehäuft werden, ohne dass es jeweils einer expliziten Behandlung der einzelnen Elemente bedarf. Herder praktiziert die gelehrte Lizenz, Materialmengen „aufs Geratewohl“ zu durcheilen. Die richtige Ordnung ist dabei zweitrangig. Die Sylvae wird definiert als Sammlung von schnell niedergeschriebenen Texten. Man schreibt nicht akademisch korrekt oder pedantisch genau, sondern aus dem Stegreif. Man formuliert aus dem Schwung heraus. Herder befreit sich aus der Flut der Bücher. Er konnte nur noch zählen, registrieren, auflisten, was es alles gibt und was noch möglich wäre. Seine Seereise ist der Aufbruch für eine Abweichung. Seine Lektüre ist nicht mehr festgelegt auf einen ursprünglichen oder autoritätsfixierten Wortlaut. Herders Suchläufe kennen keinen Abschluss. Das Universalarchiv ist uneinholbar. Eine beständige Lektüre der Menschheitsschriften ist unmöglich. „Alles“ ist nicht zu lesen, zu kennen, zu wissen. Es reicht nur zu Verweisen und Fundorten. Entscheidend ist die Zirkulation der Daten, der Datenstrom, der keinen Anfang und kein Ende hat, der neue Routen und Entdeckungen zulässt. Kanonische Wissensbestände müssen durch intelligente Suchroutinen ersetzt werden. Der liebenswerteste Gichtling Herder als Netznavigator könnte uns helfen in der Datenflut. Photo: grafixar
May 31 2011, 10:15am
Infografik: History Of Search
http://feedproxy.google.com/~r/blogpiloten/~3/DptDuguwWHI/
Aktuell diletieren ja eine Menge offizieller und selbst ernannter Experten über die Filter Bubble von Eli Pariser. Zum erweiterten Themenkreis gehört dabei natürlich die Suche, weil sie via Google unsere Sicht auf die digitale Welt (sic!) wenn nicht kreiert so doch manipuliert. Glücklicherweise waren die früheren Algorithmen namens Gatekeeper alias Qualitätsjournalisten und andere Agenturmeldungsfilterer aus ganz anderem Holz geschnitzt….
May 24 2011, 9:40am
twitter: Meine Lieblingssuchmaschine
http://feedproxy.google.com/~r/blogpiloten/~3/HhUwM3jNuuQ/
twitter hat einen unschätzbaren Vorteil: die Suchfunktion. Hier kann man permanent aktuelle Events und Trends bobachten. Aber die Suche wird auch immer wieder erweitert. Nun kann man sogar bei der Suche nach bestimmten Keywords passende Nutzer finden, die zu den Themen Inhalte und Tweets verbreiten. Vorher konnte man nur Nutzer zum Thema “Modelleisenbahn” finden, wenn diese auch den Begriff im Nutzernamen hatten, was reichlich blöd und vor allem selten ist. Jetzt merkt sich die twitter-Suche, wer zu welchen Themen etwas tweetet und schlägt bei Themensuchen auch Twitterer vor, die offenbar viel damit zu tun haben. Denn anders als bei facebook ist twitter ja nicht dazu da, sich mit Leuten zu verbinden, die man eh schon kennt sondern Leute und deren Inhalte zu finden, die einem interessant erscheinen und Neues in das tägliche Einerlei der Informationsflut bringen. Leider (oder zum Glück?) haben diese enorme Potenz von twitter noch nicht so viele erkannt… Hier gibt es mehr dazu.
April 5 2011, 10:03am
Microsoft “leiht” Suchergebnisse bei Google
http://feedproxy.google.com/~r/blogpiloten/~3/gG4D9mPiozU/
Der Vorwurf wiegt schwer. Und Verantworliche von Microsofts Suchmaschine bing versuchen erst gar nicht, die Anschuldigungen zu verneinen: bing borgt sich bei Google immer dann die Ergebnisse aus, wenn die Nutzer Kauderwelsch eingeben, also Begriffe so falsch schreiben, dass die Suchmaschine gar nichts damit anfangen kann. Seit Google eine ähnliche Technologie wie die Lösung der deutschen Firma exorbyte eingebaut hat, kann Google nämlich ungefähr erkennen, was Legastheniker, Betrunkene oder andere notorische Falschschreiber wohl meinen könnten. Und auch bei Fachbegriffen aus der Wissenschaft können sich gern mal Fehler einschleichen. Wer kann schon all die griechisch- oder lateinischstämmigen Wörter fehlerfrei in einer Tastatur hacken? In dem Fall zeigt Google immer eine zusätzliche Zeile über den Suchergebnissen an, dass es ein falsches Wort erkannt hat, wie bei Gynälolohie, da kommt dann “Meinten Sie: Gynäkologie:” und dann folgen die Ergebnisse zu dem wahrscheinlichsten richtigen Begriff. Die Firma Exorbyte hatte vor einigen Jahren zu diesem Thema Bahnbrechendes mittels der Levenshtein-Distanz auf den Markt geworfen. Damit kann man – bei schnellen Rechnern – in hoher Geschwindigkeit, fehlende oder falsche Zeichen so ersetzen, dass ein bekanntes Wort aus einer lexikalischen Liste aller bekannten Begriffe erkannt wird. Nicht so bei bing… Denn Bing verfügt nicht über so eine Technologie und läßt mittels Clickstream der Nutzer des Internet Explorer die Ergebnisse bei Google auswerten und erfährt so: Was hätte Google bei der einen oder anderen Fehlschreibung als Ergebnis geliefert und kopiert das einfach. Die Leute von Google haben es sogar nachgewiesen, indem sie sogenannte “honeypots” installierten. Sie präparierten die Ergebnisse bei bestimmten Falschschreibungen und verglichen die Ergebnisse bei bing mit diesen präparierten falschen Wörtern. Bing(o): Es wurde schnell klar, dass die Leute von Microsoft/bing die Technologie von Google im Verhalten beobachten und die Resultate dann einfach kopieren und ihrerseits in ihrer Suchmaschine verwenden. Erkennbar ist das vor allem, dass sie die Falschschreibung nicht wie bei Google mit einer Zeile “Meinten Sie...” anzeigen, sondern einfach so die Ergebnisse eines möglichen korrekten Suchwortes auflisten. Herausgefunden hat das Ganze Danny Sullivan von der Website Searchengineland. Er sprach natürlich Microsoft auf diese ungeheure Anschuldigung an: Harry Shum ist Vice President bei bing und gibt zu, dass bing anonymisierte Daten von registrierten Nutzern des Internet Explorer nutzt, um in diesem Clickstream Daten aus 1000 Quellen zu finden, die in den Algorithmus einfliessen, der bing zu einer Ergebnisliste verhilft. Diese Art, Daten der Kunden aus opt-in Datenströmen zu Verbesserung der Ergebnisse zu nutzen sei doch allgemein üblich. Das mag üblich sein. Aber das bloße Übernehmen der Ergebnisse von Konkurrenten bei Falschschreibungen ist einfach nur peinlich. Sullivan hat jetzt noch genug Beispiele gefunden, wo bing bei absoluten Fantasiebegriffen wie “hyibbprqag” und ähnlichem bing exakt dieselben Suchergebnisse zeigt wie bing. Man kann Google ja eine Menge vorwerfen. Aber bing scheint hinsichtlich der technologischen Kapazität Lichtjahre vom Konkurrenten entfernt zu sein. Es wird Zeit, dass ein echter Technologiekonzern diese Redmonder Simulation eines Softwareunternehmens übernimmt.
February 2 2011, 9:50am
Video: A conversation with Eric Schmidt #w2s
http://feedproxy.google.com/~r/blogpiloten/~3/I4RyX8tn0-w/
Gestern auf dem Web 2.0 Summit haben John Batelle und Tim O’Reilly sich mit Googles CEO Eric Schmidt unterhalten. 45 unterhaltsame Minuten:
November 17 2010, 10:05am
Musiksuche der gehobenen Art
http://feedproxy.google.com/~r/blogpiloten/~3/gdeB4HqpYjM/
“the sixty one” ist wieder einmal ein (zum Teil) neue und wie ich den Eindruck habe sinnvolle Herangehensweise Musik auffindbar zu machen, bzw. sie an den Mann/an die Frau zu bringen. Musiker und Labels können hier ihre Musik einstellen, Hörer bekommen ein leicht Bedienbares Internet-Radio, dass sie mit teilweise ungewöhnlicher, zumeist aber sehr schöner Independentmusik versorgt. Unbedingt mal vorbeischauen und stöbern und (!) bewerten.
September 21 2010, 3:04pm
Bildersuche der gehobenen Art
http://feedproxy.google.com/~r/blogpiloten/~3/BVioC_V59GI/
Gazopa gibt Orientierung im Meer der Bilder. Was mir dabei besonders gefällt, ist die Suche mittels einer selbstgezeichneten Vorlage. Leider noch nicht als Android-App vorrätig.
September 20 2010, 1:39pm
Google vs. China: Schein und Sein
http://feedproxy.google.com/~r/blogpiloten/~3/ReyidKB2bnI/
Im Streit mit China um die Zensur seines Suchdienstes hat Google nur scheinbar nachgegeben. Google will seine chinesische Geschäftslizenz erneuern, um seinen Suchdienst weiter in China anbieten zu dürfen – und gleichzeitig chinesischen Nutzern über einen Umweg auch unzensierte Suchergebnisse zeigen. Google hat den chinesischen Behörden einen Scheinkompromiss angeboten: Bislang wurden chinesische Nutzer der Website google.cn automatisch zu Googles Dienst in der chinesischen Enklave Hong Kong weitergeleitet, der ungefilterte Suchergebnisse anzeigt. Jetzt müssen die Nutzer lediglich auf einen zusätzlichen Link klicken, um auf den ungefilterten Dienst zu gelangen, der nun über die Website google.co.hk läuft. Grund ist die gesetzliche Vorgabe, dass Unternehmen Web-Server in China nutzen und dass sie damit einverstanden sein müssen, bestimmte Informationen zu zensieren. Bietet Google also eine Website namens google.cn mit einem einfachen Link an, ist an dieser Website formalrechtlich zunächst nichts auszusetzen – außer China blockiert den Zugriff auf die unzensierten Inhalte bzw. den Link zu google.co.hk…
Googles Salamitaktik In der Praxis wird Googles Maßnahme für die chinesischen Nutzer keinen Unterschied machen. Sie können nur auf die Internetinhalte zugreifen, die die chinesische Firewall durchlässt. Zensiert werden beispielsweise Informationen zu Tibet, zur Niederschlagung der Proteste auf dem Platz des Himmlischen Friedens im Jahr 1989 oder Wörter wie „Demokratie“. Fraglich ist aber, ob die chinesischen Behörden sich auf Googles Salamitaktik einlassen wollen – und nicht nur die Lizenz nicht mehr verlängern, sondern auch den Dienst in Hong Kong verbieten. Denn die Zensur ist eine genuine Voraussetzung für die Geschäftslizenz. Vorausgegangen war dem Zensurstreit eine breit angelegte Attacke auf die Google-Server Mitte Dezember. Nach Angaben der “Wall Street Journal” stahlen die Angreifer bei Google nicht nur wichtige Quellcodes, sondern verschafften sich auch Zugang zu anderen Google-Nutzerkonten von ausländischen Journalisten und chinesischen Menschenrechtsaktivisten. Neben Google waren allerdings mindestens 20 weitere große Unternehmen aus den Branchen Internet, Finanzen, Technologie, Medien und Chemie angegriffen worden. Sitten und Traditionen Der IT-Sicherheitsanbieter McAfee vermutete die Angreifer aufgrund des überaus geschickten Vorgehens in Regierungs- bzw. Militärkreisen. Die chinesische Regierung stritt allerdings jede Beteiligung ab – und verlangte: “Ausländische Firmen in China müssen die Gesetze unseres Landes befolgen und sich an die Sitten und Traditionen halten.” Google beschloss daraufhin, sich aus dem Chinageschäft nicht zurückzuziehen, jedoch seine Dienste nicht mehr zu zensieren. Hinter Googles Ankündigung, die Zensuranforderung nicht mehr befolgen zu wollen, steht daher nicht nur ein nobles Demokratieverständnis, sondern auch ein massives Sicherheitsproblem. Politische Komponente Der Fall hat auch eine politische Komponente: Google will sich chinesischem Recht nicht unterwerfen – und zu Hause in den USA ähnliche harsche Kritik wie die Unternehmen Microsoft und Yahoo einstecken müssen. Yahoo hatte vor Jahren die Identität von Yahoo-Kontoinhabern gegenüber den chinesischen Sicherheitsbehörden enthüllt, die dann prompt inhaftiert wurden. Microsoft war in Kritik geraten, da es einen „optimierten“ Baukasten für die Erstellung von Weblogs angeboten hatte, der Wörter wie „Demokratie“ automatisch ausfilterte. Beide Unternehmen hatten betont, dass sie sich rechtskonform verhalten hatten. Das „Berkman Center for Internet and Society“ der Universität Harvard schätzt, dass weltweit rund 40 Staaten den Internetzugang beschränken – zu den bekanntesten Ländern zählen neben China der Iran, Kuba und Usbekistan. Der in Weißrussland geborene Wissenschaftler Evgeny Morozov glaubt, dass die neue Internetkommunikationsdienste mindestens zweischneidig sind: Sie helfen Menschen in autoritären Staaten sich zu organisieren und zu mobilisieren, andererseits ermöglicht die neue Technik aber auch repressiven Regimes gegen diese Menschen vorzugehen. Er betont, dass die wachsenden Überwachungsmöglichkeiten moderner autoritärer Staaten von den Informationen in den sozialen Medien profitieren würden, da diese mit neuen und fortgeschrittenen Methoden des Dataminings analysiert werden könnten. Freiwilliger Verhaltenskodex Inzwischen gibt es den Versuch, die Prinzipien, die in der Allgemeinen Erklärung der Menschenrechte festgelegt wurden, auch in der Praxis zum Leben zu erwecken. Yahoo und Microsoft haben inzwischen zusammen mit Google einen freiwilligen Verhaltenskodex zur Unterstützung von freier Meinungsäußerung unterzeichnet, den die von vornehmlich von amerikanischen Menschenrechtlern und Wissenschaftlern gegründete„Global Network Initiative“ (GNI) erarbeitet hat. Darin verpflichten sie sich die Privatsphäre und Redefreiheit gemäß Artikel 12 und 19 der Allgemeinen Erklärung der Menschenrechte in ihren Diensten zu gewähren und sich politisch wie rechtlich für deren Durchsetzung einzusetzen. Andere Unternehmen haben sich bislang der Initiative nicht angeschlossen. Google ist nun das erste westliche Unternehmen, das tatsächlich einen Teil seines Auslandsgeschäfts aufs Spiel setzt, um sich gegen staatliche Zensur durchzusetzen. Man darf gespannt sein, ob andere Unternehmen folgen. Bildnachweis: twocentsmore
July 5 2010, 10:00am
Suche 2.0 - wie Suche sozial wird
http://feedproxy.google.com/~r/blogpiloten/~3/5BI2xAW1Hms/
Wer bei der Twittersuche nach bestimmten Begriffen Ausschau hält, hat sich sicher auch schon mal gewünscht, dass zunächst die Tweets seiner eigenen Follower gezeigt werden oder die Inhalte auf den Pinwänden seiner Freund bei Facebook bevorzugt werden. Dass wir solche Wünsche überhaupt haben können, basiert auf der relativ neuen Idee der Realtime-Search - also dem Durchsuchen von Inhalten, die extrem oft pro Tag oder Stunde aktualisiert werden.
Mein liebstes Beispiel ist die Suchmaschine http://www.icerocket.com, ohne die ich seit einiger Zeit gar nicht mehr im Web zurecht käme. Denn obwohl Bing und Google einen Schritt weiter sind, und man dort viel besser als früher Tweets bzw. Videos zu allerlei Themen findet, hat icerocket einen Vorteil: Ich kann direkt die Quellen, also Blogs, Tweets (auch identi.ca und jaiku), soziale Netzwerke etc. auswählen. Das ist natürlich ein Eldorado für alle Marketingberater und -mitarbeiter, die dort kostenfrei ihre Produkte, Firmen oder Kampagnen überwachen können. Leider geht das Thema Realtime-Search noch an den meisten Menschen vorbei, weil sie glauben, das sei einfach ein Gag, um alten Wein in neuen Schläuchen zu verkaufen. Und in der Tat, wer sich nicht im Web 2.0-Umfeld von Social Media umtut und mit Twitter und Blogs nichts anfangen kann, der hat keinen Mehrwert. Relevanz Doch wer sich etwas genauer mit dem Thema Suchmaschinen befasst hat, der erkennt das Potenzial. Denn seit vielen Jahren gibt es diverse Überlegungen, wie man die langen Listen an Ergebnissen aus einer Suche besser auf den Sucher oder dessen Suchworte eingrenzt. Google hat mit dem Page Rank ein mathematisch basiertes Lösungsverfahren (Algoritmus) erarbeitet, das immer wieder optimiert wird und im Kern die Verlinkung von Inhalten und ganzen Websites untereinander bewertet. Auf dieser Basis ordnet die Google-Suchmaschine die Webinhalte danach, wieviel andere Inhalte sich darauf beziehen. Neue Inhalte sind also immer etwas weniger wert als Inhalte, die schon lange im Web sind und daher von vielen Seiten referenziert werden. Es ist offenbar, dass das in nicht wenigen Bereichen Quatsch ist, weil zum Beispiel gerade in den Naturwissenschaften die neuesten Studien oft die Ergebnisse älterer Studien beinhalten und erweitern oder gar relativieren. Nun haben schon früh die Väter der Suchmaschinen daran gedacht, dass man die Suchergebnisse verbessern muss. Support Vector Engines fassen beispielsweise ein Dokument als Bündel von Vektoren auf, wobei jeder eindeutige Begriff von einem Vektor dargestellt wird. Die Software vergleicht dann einfach das “Aussehen” der Knäuel und kann vor allem mit Hilfe der Nutzer feststellen, ob und welche inhaltliche Nähe Dokumente zueinander haben. Je nach Unterstützung der jeweiligen Sprache klappt das sehr gut bis bescheiden. Noch zufälliger werden die Ergebnisse, wenn die Relevanz mit einfachen statistischen Verfahren oder mithilfe von Neuronalen Netzwerken entstehen soll (Neuronale Netzwerke sind lernfähige, autonome und selbststeuernde Softwareeinheiten, die auf der Grundlage zumeist veralteter Modelle vom Gehirn Entscheidungen treffen). All diese System sind jedoch nur dann sinnvoll, wenn man eine eher geschlossene Menge an Daten hat. Beim Durchsuchen von Streams, also ständig neuen Inhalten, helfen sie wenig. Dieses Charakteristikum weist auch der letzte Schrei der Suchtechnologie auf, der schon einige Jahre auf dem Buckel hat. Denn in den letzten Jahren entstand mit dem semantischen Web eine Idee, bestimmte Daten der Dokumente intelligent zu verknüpfen, damit Maschinen (gemeint ist Software) die Inhalte zuordnen (verstehen) können. Semantik ist ein Teil der Zeichenlehre namens Semiotik und beschreibt die Bedeutungsebene von Wörtern. Die Idee bestand darin, einfach unsere Satzkonstruktion aus Subjekt, Prädikat und Objekt auf Software zu übertragen. Denn vorher konnte Software nur Subjekte mit Objekten verbinden nach dem Prinzip Ort=Hamburg oder Band=Prodigy. Das Semantische Web soll dies nun erweitern um ein Prädikat, also eine Satzaussage wie Geburtsort oder Lieblingsband. Dann würde ein kleinste Informationseinheit nicht mehr aus zwei, sondern aus drei Elementen bestehen: Hamburg ist Geburtsort von Udo Lindenberg oder Prodigy ist Lieblingsband von Angela Merkel. Damit das überhaupt als ein Fortschritt in der Suchtechnologie aufgefasst werden kann, sollen dann Tausende von Dialekten und Sprachen erstellt werden, die diese Tripel (Menge aus drei Elementen) zu einem thematisch sinnvollen Ganzen zusammenfassen. Es gibt diese Dialekte aus Tausenden dreiwertigen Zuordnungen schon in den Naturwissenschaften und in der Bibliothekswelt. Der Nutzen für den Menschen, der eine Suchanfrage stellt, ist begrenzt auf bestimmte thematische Felder. Die Suche an sich ist keineswegs alltagstauglicher geworden. Der Mensch ist das Maß aller Dinge Das hat einen Grund, denn allerlei Prinzipien wie man Inhalte zueinander ordnet, sind immer festgeschriebene Muster, nach denen die Software einfach Inhalte zuordnet. Das hat aber kaum einen Vorteil im Alltag. Nun betritt eine neue Idee den Raum der Suchtechnologien: das Social Ranking. Denn wenn meine Suchergebnisse danach geordnet werden, was meine Kollegen oder Freunde zu einem Thema benutzt haben oder was sie veröffentlicht haben oder eben per Twitter verbreiten, dann kann die Suche die Themen meiner Lebenswelt abbilden. Suchmaschinen können dann soweit gehen und die Relevanz erweitern um den Kreis der Freunde meiner Freunde, oder (klammern wir mal das Thema Datenschutz aus, was mit Anonymisierung nur beschränkt funktioniert) um Suchende, die ein ähnliche Ausbildung und einen ähnlichen Beruf haben wie ich. Es ist sicher richtig, wenn wir Bauchschmerzen bekommen angesichts der enormen Menge an Daten, die Marktführer wie Google zu einer Person sammeln. Viele Leute befeuern diese Sammelwut noch, indem sie sogar die internen Daten ihrer Firma bei Google Docs lagern. Aber wenn wir den Begriff der Relevanz mal befreien aus den Klauen von mathematischen Lösungsverfahren und uns zurückbesinnen auf solche Begriffe wie Clans oder Freundeskreis, und dort das Zentrum sehen einer real vorhandenen Instanz an praktischem Wissen und handelnden Menschen, die uns mit der ständig wachsenden Menge an Inhalten im Web besser umgehen lässt, dann wäre es doch sicher sinnvoll, das einfach mal zu vertiefen und auszuprobieren. Mehr dazu siehe im readwriteweb.
Verwandte Artikel
Linktipps: 10 semantische Web Apps (0) Linktipp: StockMood gibt Prognosen über Aktienkurse ab (1) Begriffsklärung: Was ist das Web 3.0? (3) Zemanta – Einfach besser bloggen (1) Wolfram Alpha - Matrix reloaded? (6)
July 18 2009, 1:57pm
Seite 1




