Browser Use, ein amerikanisches Start-up, das die Art und Weise, wie KI-Agenten mit dem Web interagieren, revolutionieren möchte, hat kürzlich eine Finanzierung in Höhe von 17 Millionen Dollar in einer Seed-Runde unter der Leitung von Felicis Ventures angekündigt, mit Beteiligung von A Capital, Nexus Ventures, Y Combinator, Paul Graham, Liquid2, SV Angel und Pioneer Fund. 

Die Schnittstelle zwischen LLMs und dem Web aufbauen 

Browser Use wurde 2024 von Magnus Müller und Gregor Žunič, zwei ehemaligen Datenwissenschaftsstudenten der ETH Zürich, gegründet. Ihr Projekt entstand aus einem einfachen Wochenendexperiment, bei dem getestet werden sollte, ob Sprachmodelle (LLMs) das Web wie Menschen navigieren können. In nur vier Tagen entwickelten sie einen ersten Prototyp, den sie dann auf der Plattform Hacker News veröffentlichten. Die Begeisterung war sofort spürbar und bestätigte ihre Intuition, dass die Zukunft der KI-gesteuerten Webautomatisierung näher war, als viele dachten. Wenige Wochen später war die erste Demo bereit.
Die beiden Mitgründer erklären:
"Das Internet ist die größte Quelle unstrukturierter Daten weltweit, aber die Interaktion damit erfordert immer noch menschliche Aktionen: Klicken auf Schaltflächen, Ausfüllen von Formularen, manuelle Navigation durch Websites. Mit dem Aufstieg von LLMs und autonomen Agenten ändert sich diese Realität. Wir bauen die Infrastruktur auf, die es der KI ermöglicht, so natürlich mit dem Web zu interagieren wie ein Mensch."
Die meisten bestehenden Automatisierungslösungen basieren auf methoden, die auf der visuellen Wahrnehmung beruhen und versuchen, die menschliche Wahrnehmung von Webseiten nachzuahmen. Empfindlich gegenüber visuellen Veränderungen (Farbänderungen, Positionsänderungen von Elementen...) sind sie für die beiden Männer "langsam, teuer und unzuverlässig".  Sie haben daher eine radikal andere Strategie gewählt: Ihr Tool wandelt Weboberflächen in strukturierten Text um, wodurch es den Sprachmodellen ermöglicht wird, auf vorhersehbarere Weise mit Websites zu interagieren. Dieser Ansatz ermöglicht eine präzisere Interaktion mit Benutzeroberflächenelementen (Schaltflächen, Formulare, Menüs) und gewährleistet eine schnellere und kostengünstigere Ausführung als bildbasierte Lösungen.
Im Gegensatz zu den meisten seiner Konkurrenten kann Brower Use Cloud mit verschiedenen LLMs verwendet werden. Seine Pro-Version wird von dem Start-up für 30 $/Monat angeboten, was es zu einer flexibleren und kostengünstigeren Open-Source-Alternative zu Operator von OpenAI macht.

Schnelles Wachstum und vielfältige Anwendungsfälle

In nur wenigen Monaten hat Browser Use ein rasantes Wachstum erlebt. Sein Open-Source-Projekt, zu dem eine Gemeinschaft von über 15.000 Entwicklern aktiv beiträgt, sammelt über 48.400 Sterne auf GitHub. Seine Tools decken verschiedene Anwendungsfälle ab, darunter die Automatisierung von Anmeldungen und Webnavigation, die großflächige Datenerfassung, Qualitätssicherungstests oder CRM-Integrationen.
Mit dieser Finanzierung plant Browser Use, die Entwicklung seiner Infrastruktur zu beschleunigen und beabsichtigt zu diesem Zweck, die besten Ingenieure einzustellen.
Magnus Müller kommentiert:
"Wir glauben fest daran, dass die Interaktion zwischen KI und dem Web in den kommenden Jahren einen tiefgreifenden Wandel erfahren wird. In einigen Jahren erwarten wir, dass automatisierte KI-Interaktionen diejenigen übertreffen werden, die von Menschen durchgeführt werden."

Besser verstehen

Was ist die Technologie der Umwandlung von Webschnittstellen in strukturierten Text und warum ist sie wichtig für Browser Use?

Die Technologie der Umwandlung von Webschnittstellen in strukturierten Text ermöglicht es Sprachmodellen, Websites wie textuelle Datenbanken zu behandeln, was die Genauigkeit und Zuverlässigkeit im Vergleich zu visuellen Methoden verbessert. Dies ist entscheidend für Browser Use, da es die Abhängigkeit von menschlicher Wahrnehmung und visuellen Variationen reduziert und die Automatisierung schneller und wirtschaftlicher macht.

Wie beeinflusst die Kapitalbeschaffung von Browser Use durch verschiedene Investoren seine Entwicklungs- und Innovationsfähigkeiten?

Die Vielfalt der Investoren von Browser Use, wie Felicis Ventures und Y Combinator, bietet nicht nur finanzielle Ressourcen, sondern auch ein strategisches Netzwerk von Beratung und Partnerschaften. Dies beschleunigt seine technologische Entwicklung und Innovation, während er seine Position im Bereich der Webautomatisierung stärkt.