Базирующаяся в Тируванантапураме компания Accubits Technologies имеет GenZ 70B с открытым исходным кодом, большую языковую модель (LLM), которая в настоящее время входит в топ-лист лидеров HuggingFace, глобальной платформы, которая курирует, оценивает и сравнивает модели искусственного интеллекта.
Отлаженная модель с 70 миллиардами параметров занимает первое место в таблице лидеров HuggingFace для программируемых LLM и шестое место для открытых LLM во всех категориях. Она была разработана совместно с Bud Ecosystem, отдельной компанией Accubits, с открытым исходным кодом, говорит Ахарш МС, директор по маркетингу Accubits Technologies. Bud фокусируется на фундаментальных исследованиях в области искусственного общего интеллекта (AGI) и поведенческих наук., и строит экосистему вокруг мультимодальных, многозадачных базовых моделей.
Локально значимая
LLM (например, GPT4 от Open AI) – это тип модели машинного обучения, специально разработанный для обработки и генерации текста, похожего на человеческий, на основе огромных объемов текстовых данных. GPT-4 – самая большая модель из серии GPT OpenAI, выпущенная в этом году. Количество ее параметров не было обнародовано, хотя предполагается, что модель насчитывает более 1,7 трлн.
Модель LLM из Индии, занимающая первое место в мировом масштабе, имеет большое значение и может послужить источником вдохновения для местного сообщества разработчиков, говорит Ахарш MS. “GenZ – это авторегрессивная языковая модель с оптимизированной архитектурой transformer. Мы доработали модель с помощью кураторских наборов данных, используя метод контролируемой точной настройки (SFT) ”, – объяснил Ахарш businessline.
В ней использовался набор данных точной настройки инструкций OpenAssistant и источник мыслей для цепочки мыслей (CoT). Благодаря обширной тонкой настройке она приобрела дополнительные навыки и возможности, выходящие за рамки того, что может предложить предварительно обученная модель. В интервью Ахарш предложил более глубокое понимание мира компьютерных программ для обработки естественного языка.