Apache Hadoop - ein genauerer Blick
Apache Hadoop bietet Lösungen für die groß angelegte Erfassung und Verarbeitung von Daten. Die ASF dient als zentrales Repository und Verteilungspunkt für die Projekte, wobei Apache als Kerngemeinschaft von Benutzern und Entwicklern dient. Apache Hadoop zielt darauf ab, die Bereitstellung großer Anwendungen durch die Unterstützung der Java- und Java-Plattform auf den Servern zu erleichtern. Apache Hadoop wurde von Juhan Lamb Pedrick, Alex Balcov, Michael J. Cafarella, Gerald M. Glassner und Raymond C. Tsouline entwickelt. Es basiert auf der Technologie des NoSQL-Datenbankverwaltungssystems, das zuerst bei Facebook entwickelt und später von Twitter und Google verwendet wurde.
Apache Hadoop umfasst eine weitreichende Technologie, zu der Map-Reduce, Yago, Summation und vieles mehr gehören. Apache Hadoop wurde entwickelt, um das Map-Reduce-Framework effektiver und einfacher zu machen und gleichzeitig eine intuitive Benutzeroberfläche für Programmierer zu bieten. Apache Hadoop zielt darauf ab, sich von herkömmlichen Serverinstallationen zu einem vollständig parallelen verteilten System zu entwickeln, das Tausende von Aufgaben parallel ausführt. Es ist in der Lage, große Mengen datenintensiver Aufgaben zu bewältigen, indem es jedem Worker erlaubt, die Arbeit in kleine Teile aufzuteilen, so dass große Aufgaben vom zugrunde liegenden Cluster effizient aufgeteilt werden können.
Verteilte Datenanalyse Mit Hilfe von Apache Hadoop können Benutzer von jedem Gerät aus auf Echtzeitdaten zugreifen, ohne dass teure verteilte Systeme oder Speichermedien erforderlich sind. Apache Hadoop bietet hochskalierbare und hocheffiziente Data-Warehousing- und Data-Processing-Technologien. Mit dem Map-Reduce-Framework können Benutzer die Komplexität von Karten effektiv reduzieren, was die Entwicklung von komplexeren Graphen und Business Intelligence (BI)-Anwendungen ermöglicht. Die Benutzer können auch einfache Extract-Transform-Load (ETL)-Anwendungen erstellen, die es ETL-Handlern ermöglichen, komplexe Transformationen effizient zu verarbeiten.