У той час як оптимізація систем RAG (Retrieval-Augmented Generation) стає стратегічним пріоритетом для компаній, які прагнуть ефективно використовувати свої внутрішні корпуси, LightOn представляє GTE-ModernColBERT, багатовекторну модель із відкладеною взаємодією, розроблену для переосмислення практик пошуку інформації в складних і спеціалізованих середовищах.
Сьогодні одновекторні моделі домінують у процесах пошуку інформації завдяки їхній простоті реалізації та ефективності у загальних завданнях. Однак цей підхід досягає своїх меж, коли мова йде про складніші матеріали, такі як довгі послідовності, технічна лексика або неоднозначні формулювання, які часто виходять за межі їхньої здатності до узагальнення.
Саме на цьому полі GTE-ModernColBERT вводить значний прорив. Його архітектура відкладеної взаємодії дозволяє зберігати тонку гранулярність у токенізованих уявленнях. Замість конденсації документа в один вектор, він підтримує детальну векторну дистрибуцію, гарантуючи точнішу відповідність між запитом і релевантними сегментами документа. Цей підхід виявляється особливо ефективним для організацій, що працюють зі спеціалізованими, юридичними, науковими та регуляторними документами.
GTE-ModernColBERT базується на ModernBERT, оптимізованій версії відомого BERT (Bidirectional Encoder Representations from Transformers), представленій LightOn у грудні минулого року. Розроблений для задоволення вимог європейських компаній щодо управління даними та регуляторної відповідності, він може обробляти документи до 8192 токенів, при цьому забезпечуючи знижене затримання та кращий контроль за витратами.
Він також використовує бібліотеку з відкритим кодом PyLate, розроблену LightOn, яка оптимізує навчання моделей ColBERT і спрощує їх інтеграцію в системи відновлення інформації. Його мінімалістичний підхід дозволяє дослідникам та інженерам швидко досягати відтворюваності з оптимізованою реалізацією лише в 80 рядках коду.

Продуктивність

Щодо продуктивності, GTE-ModernColBERT є першою моделлю, яка перевершила ColBERT-small на еталоні BEIR, одному з найжорсткіших стандартів у цій галузі. Він оцінює 18 гетерогенних наборів даних, що охоплюють різні випадки використання, такі як біомедичний пошук, відкриті питання-відповіді, аналіз аргументів, форуми спільнот і наукові бази знань. З середнім балом 54,89 проти 53,79 для ColBERT-small, GTE-ModernColBERT пропонує кращу здатність до міждоменного узагальнення, що є важливим активом для змішаних і мало структурованих документальних середовищ.
Завдяки оптимізованій сумісності з основними векторними базами даних, такими як QDrant, LanceDB, Weaviate і Vespa, він полегшує впровадження надійних систем RAG для таких застосувань, як юридичний аналіз, технічна документація, підтримка клієнтів або наукові дослідження.
Спробувати GTE-ModernColBERT  на Hugging Face

Cet article publirédactionnel est publié dans le cadre d'une collaboration commerciale

Краще зрозуміти