El proyecto Open Assistant se ha creado con el objetivo de brindar a todos acceso a un modelo de lenguaje grande y basado en chat. La visión detrás de Open Assistant es que, al mejorar el lenguaje, se pueda impulsar una revolución en la innovación en este campo, tal como la tecnología de difusión estable permitió hacer arte e imágenes de nuevas maneras.
Open Assistant Google: Una nueva IA conversacional de código abierto
Open Assistant Google es un nuevo proyecto de código abierto para crear una IA conversacional de alta calidad para todos. Está organizado por LAION, una organización de investigación de Google AI.
Open Assistant se basa en el modelo de lenguaje de gran tamaño Bard, que también es desarrollado por Google AI. Bard es un modelo de lenguaje factual entrenado en un conjunto de datos masivo de texto y código. Puede generar texto, traducir idiomas, escribir diferentes tipos de contenido creativo y responder a sus preguntas de manera informativa.
Open Assistant aún está en desarrollo, pero tiene el potencial de revolucionar la forma en que interactuamos con las computadoras. Al proporcionar una IA conversacional de alta calidad para todos, Open Assistant puede hacer que las computadoras sean más accesibles y fáciles de usar para una amplia gama de personas.
Cómo contribuir
El proceso de recopilación de datos está disponible en línea en open-assistant.io. Los usuarios pueden iniciar sesión y comenzar a participar en tareas. El objetivo es recopilar una gran cantidad de datos de alta calidad. Al enviar, clasificar y etiquetar los prompt y las respuestas del modelo, los usuarios estarán ayudando directamente a mejorar las capacidades de Open Assistant.
Además, los usuarios también pueden correr la aplicación de recopilación de datos localmente para contribuir al proceso de desarrollo. Esto se puede hacer mediante el uso de Docker.
El plan
El objetivo de Open Assistant es alcanzar un MVP inicial lo antes posible siguiendo los 3 pasos descritos en el paper InstructGPT. La meta es recopilar más de 50,000 muestras de cumplimiento de instrucciones generadas por humanos (prompt + respuesta). Se utilizará un proceso de crowdsourcing para recopilar y revisar los prompt, evitando así la recopilación de datos inútiles o poco fiables. Se creará una tabla de clasificación para motivar a la comunidad y mostrar el progreso, y se recompensará a los contribuyentes más activos.
A continuación, se entrenará un modelo de recompensa basado en los datos de clasificación recopilados. Luego, se utilizará el modelo resultante para continuar con la muestra de cumplimiento en la siguiente iteración.
La visión
Open Assistant no se detendrá en replicar ChatGPT. La meta es construir el asistente del futuro, capaz de no solo escribir correos electrónicos y cartas de presentación, sino también de realizar trabajos significativos, usar APIs, investigar dinámicamente información y mucho más, con la capacidad de ser personalizado y abierto para todos los desarrolladores.
Algunas ventajas que podemos encontrar frente a otros algoritmos como Chat Gpt-3 de OpenAI, Bard de Google o la integración de GPT-3 en Bing.
- Accesibilidad: Uno de los objetivos principales de Open Assistant es hacer que el acceso a un modelo de lenguaje de gran tamaño sea accesible para todos, en comparación con GPT-3, que solo está disponible para un número limitado de empresas y organizaciones.
- Abierto y personalizable: Open Assistant es un proyecto de código abierto, lo que significa que cualquiera puede contribuir y personalizar el modelo según sus necesidades. GPT-3, por otro lado, es propiedad de OpenAI y su uso está limitado por los términos y condiciones de la compañía.
- Mejora continua: Open Assistant está diseñado para ser un proyecto en constante evolución y mejora. Los usuarios pueden contribuir a la recopilación de datos y al desarrollo del modelo, lo que permite una mejora continua en términos de capacidad y eficiencia.
En resumen, Open Assistant es una opción atractiva para aquellos que buscan un modelo de lenguaje de gran tamaño accesible, personalizable y en constante mejora.