OpenAI Trabaja con Reddit: ¿Se Unirán?
Reddit, el mayor foro online con 430 millones de usuarios mensuales, tiene un subreddit activo llamado "OpenAI". Aquí la gente discute sobre las últimas tecnologías de inteligencia artificial.
La conexión entre Reddit y OpenAI va más allá. Según el artículo académico (Language Models are Unsupervised Multitask Learners), escrito por Alec Radford, Jeffrey Wu y otros expertos técnicos en IA, se dice que Reddit fue usado como fuente de entrenamiento para OpenAI.
Si estás interesado en el chatbot de OpenAI y Reddit, continúa el artículo y explora cómo trabajan juntos.
- Parte 1 : ¿Qué es OpenAI ChatGPT?
- Parte 2 : ¿Por qué OpenAI necesita Reddit?
- Parte 3 : ¿Cómo funciona OpenAI con Reddit?
- Parte 4 : Resultados de la cooperación entre Reddit y OpenAI Chatbot
- Parte 5 : ¿Integrará Reddit el chatbot de OpenAI?
- Parte 6 : ¿Cómo puede beneficiarse Reddit de OpenAI Chatbot si se integra?
- Parte 7 : Preguntas frecuentes
Parte 1: ¿Qué es OpenAI ChatGPT?
ChatGPT es un chatbot de IA, y OpenAI es la empresa que lo diseña. A diferencia de otros, ChatGPT es más avanzado debido al modelo que utiliza para entender el lenguaje, que es similar al de los humanos. Las tres letras de GPT significan Generative Pre-trained Transformer, un tipo de gran modelo de lenguaje caracterizado por el entrenamiento y el aprendizaje profundo. Según OpenAI, ChatGPT se entrena mediante el método Reinforcement Learning from Human Feedback (RLHF).
Actualmente, el chatbot de OpenAI es capaz de responder a preguntas realizadas por los usuarios y dar una respuesta similar a la humana. Algunas tareas que puede llevar a cabo: generar nuevo código; averiguar errores; redactar correos electrónicos, redacciones y mucho más.
Las capacidades de ChatGPT son infinitas ya que explora a partir de la información con la que ha sido entrenado para recuperar las respuestas o datos más adecuados a las preguntas realizadas. Cabe destacar que los datos de entrenamiento son anteriores a septiembre de 2021.
Fuente: openai.com
Parte 2:¿Por qué OpenAI necesita Reddit?
ChatGPT se basa en su método de entrenamiento para procesar el lenguaje natural. Y los datos generados a través de Internet funcionan como su fuente principal para recuperar la información más relevante para la pregunta formulada. Reddit es uno de los recursos de conocimiento del chatbot de OpenAI.
Reddit tiene una enorme cantidad de usuarios activos. Es la razón principal para convertirse en el medio de entrenamiento. Además, OpenAI utiliza Reddit también por su comunidad diversa y activa y su sistema de votos a favor y en contra. Estos proporcionan varias muestras para hacer ChatGPT el chatbot de IA más como una persona viva y deducir las preferencias de la personas.
Hay alrededor de 138.000 subreddits activos en la actualidad, que abarcan temas como noticias, música, películas, juegos, ciencia, arte, libros, deportes, TI, etc. La utilización del rico y variado contenido de Reddits contribuye al rendimiento y las capacidades del modelo lingüístico de OpenAI. Es útil para que el chatbot de IA genere texto basado en el contexto.
Las razones pueden resumirse así::
- Reddit es una de las muchas fuentes de información disponibles en línea, generada por sus millones de usuarios diarios, y proporciona datos de texto disponibles públicamente sobre una amplia gama de debates y temas. Al utilizar los datos de Reddit, OpenAI mejora el entrenamiento de sus modelos lingüísticos para su chatbot de IA.
- La participación y las preferencias de los usuarios activos en la comunidad de Reddit proporcionan información altamente correlacionada para rastrear y ayudar con el análisis estadístico. Esto permite al chatbot de OpenAI dar respuestas precisas.
Parte 3: ¿Cómo funciona OpenAI con Reddit?
OpenAI utiliza el modelado del lenguaje como enfoque principal y realiza la estimación basándose en un grupo de ejemplos. Esquematiza el texto y los carácteres para calcular las probabilidades condicionales a través del lenguaje del modelo diseñado y, a continuación, generará contenido.
En este modelo, Reddit desempeña el papel de proporcionar ejemplos que se denominan Conjunto de Datos de Entrenamiento.
OpenAI crea un web scrape para rastrear páginas web de forma selectiva. Y se centrará en recopilar textos realizados por usuarios. La compañía ha scrapeado todos los enlaces salientes de Reddit, que obtienen 3 estrellas o más. El karma funciona como un reflejo de la calidad del contenido.
Fuente: Los modelos lingüísticos son capaces de aprender varias tareas sin supervisión
Como apunte, el chatbot de OpenAI emitirá la respuesta después de procesar y traducir, en lugar de utilizar directamente los textos de su archivo de entrenamiento.
Parte 4: Resultados de la cooperación entre Reddit y OpenAI Chatbot
Reddit participó en los experimentos de GPT-2. Proporcionó muchos datos que permitieron al equipo explorar posibilidades de mejora. Entonces, trabajando sobre esta base, OpenAI lanza GPT-4.
Ahora, en GPT-4, OpenAI muestra los resultados del entrenamiento. En el informe técnico de GPT-4, Reddit se utiliza como ejemplo para demostrar cómo el modelo GPT entiende las imágenes.
Fuente: Informe técnico GPT-4
¿Habrá más entrenamientos de entre OpenAI y Reddit?
Es difícil de decir.
El New York Times informó el 18 de abril de este año que Reddit cobrará por ayudar a la formación AI Systems. Google y OpenAI están en el punto de mira. Puede acabar con la cooperación entre ambas. El futuro sigue siendo incierto.
Parte 5: ¿Integrará Reddit el chatbot de OpenAI?
Por el momento, no hay noticias oficiales sobre la integración de Reddit en el chatbot de OpenAI.
Reddit es de registro gratuito pero cuenta con un plan Premium para ofrecer funciones extra. Teniendo en cuenta que OpenAI cobra tasas por usar el chatbot de IA comercialmente, Reddit pedirá un pago a su usuario si se integra. Pero hasta hoy, no hay ninguna función relacionada en el plan Premium de Reddit.
Parte 6: ¿Cómo puede beneficiarse Reddit de OpenAI Chatbot si se integra?
Los principales beneficios de insertar ChatGPT recaen en la búsqueda de comunidades/contenidos, el resumen de post-contenidos, el rastreo de fuentes de información y la gestión de subreddits.
1) Mejor búsqueda de comunidades y puestos de interés.
Debido al gran volumen de grupos y publicaciones, los usuarios de Reddit pueden tener problemas para encontrar una determinada comunidad relacionada con los temas que les interesan. Al utilizar el chatbot de IA, la velocidad de búsqueda será mucho más rápida. Además, puede utilizar bien el mecanismo de filtrado y proporcionar una lista de recomendaciones a los usuarios para mejorar su experiencia.
2) Extraiga el resumen del puesto en segundos.
Una respuesta larga anexa a un post puede ahuyentar a la gente. En efecto, la gente se impacienta por leer textos largos. Y cantidad no es igual a calidad. OpenAI puede echarle una mano.
3) Encuentra las fuentes de información escritas en la respuesta del post.
Los usuarios de Reddit pueden tener la exigencia de verificar la fuente utilizada en un post porque la fiabilidad es importante en la actual era de explosión de información. Para OpenAI ChatGPT entrenado con una gran cantidad de datos, encontrar la fuente de información es bastante sencillo.
4) Gestiona subreddits como moderador de subreddits de IA.
Mantener los subreddits saludables es esencial para que los sitios públicos funcionen mejor. OpenAI puede utilizarse como robot de IA para moderar los mensajes y las respuestas. Ayudará a detectar spam y contenido inapropiado, identificar infracciones, revisar las cualificaciones de los miembros, etc.
Deja una respuesta.