Bachelorarbeit aus dem Jahr 2010 im Fachbereich Informatik - Wirtschaftsinformatik, Note: 1.3, Technische Universität Dresden, Sprache: Deutsch, Abstract: Das rasante Wachstum des Internets hält kontinuierlich an und verknüpft eine unvorstellbar große Menge an Daten. Schon lange ist es auf eine Größe angewachsen, bei der eine sinnvolle Nutzung ohne automatisierte Hilfsmittel nicht mehr möglich ist. Zwar ist aufgrund der dezentralen Struktur des Internets eine genaue Berechnung des existenten Datenumfangs kaum möglich, erhobene Schätzungen versuchen aber einen Eindruck davon zu vermitteln. So besagt eine Studie der IDC, dass sich die digitalen Informationen bereits 2006 auf 161 Exabyte belief. Vorhersagen über die weitere Entwicklung gehen davon aus, dass diese Masse sich bis 2010 von 161 auf 988 Exabytes mehr als versechsfacht hat. Außerdem ergab die Studie, dass ca. 95% der Daten im Internet in unstrukturierter Form vorliegen. Diese nutzbringend zu verarbeiten, stellt eine große Herausforderung dar (Gantz, 2007). Eine effektive Suche nach relevanten Informationen in dieser digitalen Welt bildet den Grundstein der Informationsgewinnung. Kurz nach der Erfindung des World Wide Webs galt in den Jahren 1991 bis 1994 das 'Browsen' als die dominierende Fortbewegungsmethode in diesen Netz. Parallel dazu entwickelten sich die ersten Webcrawler, welche die Dokumente des Internets automatisch durchsuchen und in Datenbanken indexierten. Die automatische Volltextsuche wurde möglich. Mit dieser neuen Option wandelte sich das Suchverhalten der Nutzer. Anstatt zu erraten, welche Listeneinträge am passendsten sind, konnten nun Suchbegriffe eingegeben und die Relevanz einzelner Treffer einer Ergebnisliste überprüft werden. Die Geschwindigkeit des Suchens wurde durch dieses neue Konzept erheblich erhöht, nicht aber die Geschwindigkeit des Findens. Denn auch die Anzahl der potentiell relevanten Ergebnisse stieg deutlich an (Buzinkay, 2006, S. 177). So durchsuchen Webcrawler stetig das Netz nach relevanten Informationen. Doch bleibt ihnen der größte Teil des World Wide Webs verborgen und nur ein Teil der tatsächlich vorhandenen Dokumente kann gefunden werden. Darüber hinaus liefert eine konkrete Suchabfrage eine so unfassbar große Menge an Treffern, dass die Wahrscheinlichkeit eines Fundes beim ersten Ergebnis der Wahrscheinlichkeit eines Lottogewinns nahe kommt. Durch Mehrdeutigkeiten im Text, die Komplexität und die schiere Masse des WWW stoßen traditionelle Suchmaschinen schnell an ihre Grenzen (Sack, 2010, S. 14).
Kaufen Sie hier:
Horizontale Tabs
Weitere E-Books zum Thema: Informatik - Algorithmen - Softwaresysteme
Grundlagenwissen im Bereich Informatik
Es gibt kaum ein technisches oder naturwissenschaftliches Problem, das nicht von der Informatik beeinflusst wird. Deshalb gehören die Grundlagen der…
Grundlagenwissen im Bereich Informatik
Es gibt kaum ein technisches oder naturwissenschaftliches Problem, das nicht von der Informatik beeinflusst wird. Deshalb gehören die Grundlagen der…
Grundlagenwissen im Bereich Informatik
Es gibt kaum ein technisches oder naturwissenschaftliches Problem, das nicht von der Informatik beeinflusst wird. Deshalb gehören die Grundlagen der…
Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…
Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…
Software-Projekte geraten oft in Schwierigkeiten: Zeit und Budget werden überschritten; das Projekt tritt auf der Stelle; im schlimmsten Fall wird es ohne Ergebnis abgebrochen. Manche…
Architektur-Design und Prozessorientierung Format: PDF
Das Lehrbuch behandelt alle Aspekte der Software-Entwicklung, besonders aber Methoden und Richtlinien zur Herstellung großer und qualitativ hochwertiger Softwareprodukte. Es vermittelt das zur…
Architektur-Design und Prozessorientierung Format: PDF
Das Lehrbuch behandelt alle Aspekte der Software-Entwicklung, besonders aber Methoden und Richtlinien zur Herstellung großer und qualitativ hochwertiger Softwareprodukte. Es vermittelt das zur…
Vertrauen ist gut - Corporate Performance Management ist besser - Management- und Technologieaspekte werden gemeinsam und verständlich dargestellt
- Zahlreiche Praxisbeispiele aus der…
Vertrauen ist gut - Corporate Performance Management ist besser - Management- und Technologieaspekte werden gemeinsam und verständlich dargestellt
- Zahlreiche Praxisbeispiele aus der…
Altenheim ist die Fachzeitschrift für Träger, Heimleitungen und leitende Mitarbeiter/innen der teilstationären und stationären Altenhilfe. Hier erfahren Sie, wie Sie Ihre Einrichtung zu ...
Das artist window stellt Künstler bzw. deren Werke vor und gibt somit einen Einblick in die Ateliers und Werkstätten der Kunstschaffenden. Das besondere am artist window ist, dass die ...
Die Fachzeitschrift FREIE WERKSTATT berichtet seit der ersten Ausgaben 1994 über die Entwicklungen des Independent Aftermarkets (IAM). Hauptzielgruppe sind Inhaberinnen und Inhaber, Kfz-Meisterinnen ...
Auflagenstärkste deutschsprachige Bonsai-Zeitschrift, basierend auf den renommiertesten Bonsai-Zeitschriften Japans mit vielen Beiträgen europäischer Gestalter. Wertvolle Informationen für ...
Card Forum International, Magazine for Card Technologies and Applications, is a leading source for information in the field of card-based payment systems, related technologies, and required reading ...
Das Magazin der christlichen Gewerkschaften: Christliche Gewerkschaft Metall (CGM) Christliche Gewerkschaft Deutscher Eisenbahner (CGDE) Christliche Gewerkschaft Bergbau, Chemie, Energie (CGBCE) ...
Behandlung versicherungsrelevanter Themen. Erfahren Sie mehr über den DVS. Der DVS Deutscher Versicherungs-Schutzverband e.V, Bonn, ist der Interessenvertreter der versicherungsnehmenden Wirtschaft. ...
rfe-Elektrohändler ist die Fachzeitschrift für die CE- und Hausgeräte-Branche. Wichtige Themen sind: Aktuelle Entwicklungen in beiden Branchen, Waren- und Verkaufskunde, Reportagen über ...
Die »DVGW energie | wasser-praxis« ist die führende Fachzeitschrift der deutschen Gas- und Wasser Branche. 11 Mal im Jahr informiert sie mit technischen Fachbeiträgen, praxisorientierten ...
Das unabhängige Magazin für Anwender und Entwickler, die mit dem Datenbankprogramm Claris FileMaker Pro arbeiten.
In jeder Ausgabe finden Sie von kompletten Lösungsschritten bis zu ...