Open Assistant е проект, чиято цел е да даде на всеки достъп до страхотен базиран на чат голям езиков модел.
Наскоро LAION общност (Large-Scale Artificial Intelligence Open Network), разкрита чрез съобщение първата версия на проекта «OpenAssistant»., който разработва чатбот с изкуствен интелект, способен да разбира и отговаря на въпроси на естествен език, да взаимодейства със системи на трети страни и динамично да извлича необходимата информация.
За тези, които не са запознати с LAION, трябва да знаете, че той разработва инструменти, модели и колекции от данни за създаване на безплатни системи за машинно обучение (например колекцията LAION се използва за обучение на модели на системата за синтез на изображения Stable Diffusion).
В допълнение към код за обучение и организиране на работа на бота на вашия компютър, предлага се да се използва колекция от готови модели да използва вече обучен и езиков модел, обучен на базата на 600 хиляди примера за диалози под формата на заявка-отговор (инструкция-изпълнение), подготвени и преработени с участието на общност от ентусиасти.
Беше пусната и онлайн услуга за оценка на качеството на чатбота, използвайки модела на знания OA_SFT_Llama_30B_6, който обхваща 30 милиарда параметъра.
Нашият екип работи неуморно през последните няколко месеца, събирайки огромни количества информация и обратна връзка, базирана на текст, за да създаде невероятно разнообразен и уникален набор от данни, специално предназначен за обучение на езикови модели или други AI приложения.
С над 600 000 точки от данни, генерирани от хора, покриващи широк спектър от теми и стилове на писане, нашият набор от данни ще се окаже безценен инструмент за всеки разработчик, който иска да създаде модели за обучение от следващо поколение.
За повишаване на ефективността на системата и избягвайте необходимостта от съхранява голямо количество предварително зададени параметри, проектът предвижда възможност за използване на динамично актуализирана база от знания, която може да извлича необходимата информация чрез търсачки или външни услуги.
Например, когато генерира отговори, ботът може да получи достъп до външни API, за да получи допълнителни данни. От разширените функции се подчертава и поддръжката за персонализиране, тоест възможността за адаптиране към конкретен потребител въз основа на техните предишни фрази.
За тези, които се интересуват от инсталирането на OpenAssistant, трябва да знаете, че можете да го инсталирате локално и че кандидатите за Pythia SFT модели са достъпни от HuggingFace и могат да бъдат заредени чрез библиотеката HuggingFace Transformers. Като такива е възможно те да могат да се използват с достатъчен хардуер. Има и пространства на HF, които могат да се използват за чат с кандидата за OA без собствен хардуер. Тези модели обаче не са окончателни и могат да доведат до лоши или нежелани резултати.
LLaMa SFT моделите не могат да бъдат пуснати директно поради лиценза на Meta, но теглата на XOR ще бъдат пуснати скоро.
Важно е да споменем, че текущият най-малък модел (Pythia) има 12B параметри и е труден за работа на потребителски хардуер, но може да работи на един професионален GPU. В бъдеще може да има по-малки модели и се надяваме да усъвършенстваме методи като целочислено квантуване, което може да помогне за изпълнението на модела на по-малък хардуер.
Проектът не планира да спре да повтаря възможностите на ChatGPT. Очаква се Open-Assistant да стимулира развитието на отвореното развитие в областта на генерирането на съдържание и обработката на заявки на естествени езици, точно както проектът с отворен код Stable Diffusion стимулира развитието на инструменти за генериране на изображения.
Кодът на проекта е написан на Python и се разпространява под лиценза Apache 2.0. Разработките на OpenAssistant могат да се използват за създаване на ваши собствени интелигентни асистенти и диалогови системи, които не са обвързани с външни API и услуги. Конвенционалният потребителски хардуер е достатъчен за работа, например, възможно е да работите на смартфон. Данните на Open Assistant се публикуват под лиценз Creative Commons, който позволява широк спектър от употреби, включително търговска употреба.
И накрая, ако се интересувате да можете да научите повече за него, както и да можете да се консултирате с изходния код, можете да се консултирате с подробностите В следващия линк.