• Виктор
  • Статьи
  • 1 мин. чтения

Российские ученые представили новую архитектуру быстрых языковых моделей


© Wallpaper Flare

ReBased требует меньше вычислительных ресурсов и ускоряет работу с длинным текстом, почти не теряя в качестве. Это важно для широкого коммерческого внедрения языковых моделей, а также имеет значение для экологии. Более низкая нагрузка на вычислительные мощности позволит сократить энергопотребление, а значит, работа крупных дата-центров будет меньше сказываться на окружающей среде.

В новой разработке ученые T-Bank AI Research проанализировали и откорректировали архитектуру Based, которую в конце 2023 года представили стэнфордские ученые. Они доработали механизм извлечения информации из текста, добавив новые обучаемые параметры, отвечающие за оптимальный поиск взаимосвязей между частями текста. Другое усовершенствование упростило алгоритм выделения информации из текста, что повысило производительность и качество работы архитектуры. В результате понимание взаимосвязей в тексте в среднем улучшилось на 10%.

Новая архитектура может снизить издержки на использование ИИ для специализированных задач с конкретной областью применения и рядом особенностей, которые нужно учитывать. Как пример — в области медицины это может быть классификация текстов на основе симптомов и диагнозов.

Основанные на ReBased модели менее требовательны к ресурсам, но при этом качество генерируемых текстов практически не страдает.

Специалисты T-Bank AI Research провели эксперименты на датасете MQAR (Multi-Query Associative Recall), позволяющем оценить способность модели к контекстуальному обучению, а именно к ассоциативному запоминанию (запоминанию не связанных пар объектов), например: лицо человека — его имя.

Подробное описание модели и результаты экспериментов они опубликовали в статье Linear Transformers with Learnable Kernel Functions are Better In-Context Models. Исходный код и дополнительные материалы доступны на GitHub.

Ученые представили это исследование на 63-й Международной ежегодной конференции по компьютерной лингвистике (ACL). Она прошла в Бангкоке (Таиланд) с 11 по 16 августа 2024 года и считается главным научным мероприятием в области обработки естественного языка в мире.

Выдержки из работы в своих статьях приводили представители Принстонского университета и Университета Карнеги-Меллона — одни из самых известных исследователей эффективности ИИ. Их наработки применяются почти во всех языковых моделях.

Ученые T-Bank AI Research убеждены, что в перспективе линейные модели, подобные ReBased, будут использоваться все чаще в комбинации с трансформерами в качестве составной части гибридных архитектур, поскольку они сочетают в себе скорость и высокое качество выполнения задач.


Источник: https://naked-science.ru/article/hi-tech/rossijskie-uchenye-predst


Source: https://oaoo.ru/hi-tech/rossiiskie-ychenye-predstavili-novyu-arhitektyry-bystryh-iazykovyh-modelei.html

Межтекстовые Отзывы
Посмотреть все комментарии
guest

Инженеры разработали солнечный парус с ладонь. Он почти в тысячу раз тоньше человеческого волоса

IKAROS — японский космический аппарат с солнечным парусом. Он стал первым в истории космическим парусником, продемонстрировавшим возможность межпланетного...

ИИ-переводчик со 100 языков превзошел все существующие аналоги

Разработчики представили языковую модель, которая переводит с одного языка на другой точнее аналогов / © Автор неизвестен, stock.adobe.com...

Финны построят «песчаную батарею» для отапливания целого города

Прототип «песчаной батареи» от Polar Night Energy, работающий с 2022 года / © Polar Night Energy Зеленая энергетика,...

Только «плохие» научные работы показали влияние радиоволн на живые организмы, а качественные — нет

Рабочие выполняют монтаж вышки сотовой связи в Сиднее, Австралия / © Dan Himbrechts, AAP Image, Reuters Свежее исследование...

Электронный «нос»-антенна поможет распознать несвежесть продуктов и «запах» болезней

На смену человеческому обонянию приходит «антенный нос» / © PxHere, Canon IXUS 230 HS Главной задачей исследователей было...

Ученые восстановили эрекцию у кроликов и свиней с помощью 3D-печати

Распечатанная на 3D-принтере ткань полового члена помогла ученым вернуть кроликам и свиньям эректильную функцию / © www.torontohumanesociety.com По...

Увлажнитель воздуха — источник здоровья или опасных микрочастиц?

Реклама сообщает нам, что увлажнители воздуха решают многие проблемы со здоровьем. И в каком-то смысле все так. Но...

Киригами позволит создать радиоантенны из наночастиц для космоса

Киригами / © fdecomite Киригами — искусство создания объемных бумажных объектов только путем сгибания и разрезания. Изначально эту...

Вышки 5G существенно увеличат время автономной работы мобильных телефонов 

Чем больше вышек 5G будет построено на единицу площади, тем сильнее сократится общее энергопотребление сетей базовых станций и...

Гонка загородного строительства в России: какая технология придет первой?

Реклама. ООО «Технониколь – строительные системы». ERID: 2VtzqwqzKGV. На фото: панельно-каркасный дом / © «Технониколь» Почему мы стали...

Инженеры создали робота, пишущего от руки

Полностью собранный рукописный аппарат, который пишет на листе бумаги / © Tianyi Huang et al. Несмотря на растущую...

Создана краска, охлаждающая автомобили в жару

Nissan испытывает новое охлаждающее покрытие, которое может «остудить» автомобили, припаркованные под прямыми солнечными лучами, более чем на 10...

Робот-голубь подсказал, как сконструировать самолет без хвостового киля

PigeonBot II рефлекторно меняет форму крыла и хвоста, чтобы летать без стабилизатора / @ Eric Chang et al....

Китай перехватил у США лидерство в важнейших технологических областях

© Ma Xiping, Xinhua В отчете Critical Technology Tracker специалисты ASPI оценили научно-технологический потенциал разных стран, исходя из...

Российские ученые создали первую в мире открытую виртуальную среду для самообучающегося ИИ

Автомобили Waymo бибикают друг на друга ночью на парковке в США, 2024 год. Жители окрестных домов были не...

Новый материал под воздействием ультрафиолета изменил блеск серебра на золотой

Металлический блеск на покрытии изделий наносит вред окружающей среде / @ Canon EOS-1D X, PxHere Драгоценные металлы, ценившиеся...

Гигантская экономия: как исследователи из Сибири снизят расход топлива самолетов

С.н.с ИТПМ СО РАН Андрей Иванов и доктор физ.-мат.наук, член-корреспондент РАН Андрей Бойко на фоне аэродинамической трубы Т-324...

Российские ученые представили новую архитектуру быстрых языковых моделей

© Wallpaper Flare ReBased требует меньше вычислительных ресурсов и ускоряет работу с длинным текстом, почти не теряя в...

Сила накопления: как работают аккумуляторы

Сила накопления: как работают аккумуляторы / © Naked Science Накопители энергии — устройства для сохранения и последующего использования...

Ученые разработали беспроводное смарт-кольцо для управления умным домом

Компактный размер кольца позволяет носить его весь день и управлять девайсами без голосовых команд / @ Shyamnath Gollakota...