ChatGPT uno de los avances más importantes en Inteligencia Artificial.

Contenido

En nuestra empresa nos tomamos muy en serio mantenernos al tanto de los últimos avances en ciencia, tecnología y computación. Como un beneficio para nuestros clientes y para nuestros propios negocios, revisamos con frecuencia las últimas noticias y actualizaciones en el algoritmo de las redes sociales y de los motores de búsqueda, así como en progresos y evoluciones de WordPress, lenguajes de programación y plataformas de desarrollo y creatividad.

2022 ha tenido -desde nuestra perspectiva- una fortísima temática de Inteligencia Artificial AI y Machine Learning ML. Miles de desarrolladores en todo el planeta trabajan en redes neuronales y complejos algoritmos con el fin de desarrollar herramientas computacionales que borran la linea entre lo imposible y lo imposible y aquellos aspectos de creación que alguna vez fueron exclusivos de los humanos, como la creatividad y la expresión artística y esta es precisamente la razón de nuestra emoción por ChatGPT.

En Paradise Services hemos probado y usamos para nuestros trabajos y clientes, herramientas como Jasper, Dall•E, Stable Difusion y Mid Journery para lograr resultados de alta calidad en poco tiempo y guiar nuestro proceso creativo y trabajos tradicionales. Al mismo tiempo monitoreamos información, blogs, foros y noticias de las diferentes comunidades de ciencia y tecnología ansiosos de descubrir las últimas ventajas, creaciones y avances en el mundo de la inteligencia artificial.

Hace poco recibimos un correo directamente de Open AI comunicando la apertura al público de ChatGPT, una herramienta aún en desarrollo pero con lo que parece ser uno de los mayores potenciales para cambiar el status quo de creación de contenido, desarrollo de códigos, motores de búsqueda y estrategias SEO y SEM. Así que por supuesto nos lanzamos sobre ella tan pronto recibimos la invitación para probar sus capacidades al mismo tiempo que leíamos la documentación y las experiencias y opiniones de expertos y usuarios Beta como nosotros acerca de ChatGPT.

Y bueno estamos maravillados con ChatGPT y quizás un tanto nerviosos -por razones diferentes a las que deberían estarlo Google, Bing y Duck Duck Go- En esta entrada encontrarás una guía completa y una repaso a nuestras experiencias con ChatGPT, como se compara a otras herramientas de AI generadoras de Texto, que la hace especial, cómo puede poner en Jaque a Google y que podemos esperar de ella en un futuro.

Pero primero lo primero hablemos un poco de Open AI.

¿Qué es Open AI?

OpenAI es una empresa de investigación e implementación de IA (Inteligencia Artificial). La empresa define su misión como “asegurar que la inteligencia artificial general (AGI) beneficie a toda la humanidad.”

OpenAI LP es dirigida por la junta de la organización sin fines de lucro OpenAI, compuesta por los empleados de OpenAI, LP Greg Brockman (presidente y presidente), Ilya Sutskever (director científico) y Sam Altman (CEO), y los no empleados Adam D’Angelo, Reid Hoffman , Will Hurd, Tasha McCauley, Helen Toner y Shivon Zilis. Con inversores que incluyen Microsoft, la fundación benéfica de Reid Hoffman y Khosla Ventures.

A la fecha Open AI ha liberado varios productos de inteligencia artificial los principales son:

  • Whisper una herramienta avanzada de inteligencia aritificial enfocada en la captura, comprensión y transcripción de lenguaje a texto a través de audio.
  • Dall•E2 es una generador de imágenes con base a texto que se ha expandido a editor y procesador de imágenes. Dall•E es una de las herramientas AI más atractivas y sorprendentes desarrolladas en los últimos años y abierta al público aunque aún en estado Beta.
  • Chat GPT: Una herramientas de optimización de los modelos de lenguaje para el diálogo. (aunque en nuestro parecer esta descripción se queda corta)

ChatGPT un super Chat Bot

ChatGPT singnifica Chat Based Generative Pretrained Transformer, su función es generar texto en forma de discurso humano. En otras palabras es un Chat Bot y los chat bots no son nuevos, han formado parte del internet por décadas y con el tiempo su interacción se ha vuelto tan robusta que muchas veces interactuamos con ellos sin ni siquiera saberlo.

ChatGPT-Paradise-Servicescr
Chat GPT imagen creada por Dall•E

Paradise Engine por ejemplo usa Chat Bots para hasta 30 niveles de interacción con usuarios no premium en nuestras tiendas virtuales. Ellos son los encargados de ofrecer descuentos, dar números de tracking a los pedidos, comunicar ofertas y categorizar las solicitudes de atención al cliente según su clasificación en consultas, dudas, búsqueda, clarificación, reclamos y aclaraciones. Nuestro Chat Bot se llama Mambo en honor a la mascota del director de la empresa.

La integración de Chatbots nos ayuda a atender de manera simultanea y satisfactoria a un numero mucho más grande de personas de las que podríamos atender de manera personal y además nos permite hacerlo a todas horas y en todas partes del mundo. Mientras que dejamos a nuestros agentes humanos aquellos casos más complejos y urgentes que requieren de juicio, criterios y creatividad para conseguir una solución.

Sin embargo estos chat bots se basan más en árboles de respuestas que en un criterio conversacional capaz de crear hilos o mantener memorias de las conversaciones o comprender contextos, incluso algunos modelos de Chatbots con una función conversacional más intuitiva son capaces solamente de elegir una respuesta por interacción dentro de un banco de respuestas previas con un alto índice de satisfacción a dicha consulta.

Aquí es dónde ChatGPT empieza a brillar. ChatGPT es capaz de entender, recordar e hilar y es apenas el tercer modelo de lenguaje más poderoso de OpenAI. Estas capacidades de ChatGPT de establecer e interactuar en una conversación con humanos implica un punto de inflexión en la “Prueba de Turin” haciendo a esta nueva herramienta indistinguible de un humano mediante conversación únicamente, es decir que podrías pasar años hablando con ChatGPT y ni siquiera imaginar que estás hablando con un robot.

En palabras de su creadores.

Hemos entrenado un modelo llamado ChatGPT que interactúa de forma conversacional. El formato de diálogo hace posible que ChatGPT responda preguntas de seguimiento, admita sus errores, cuestione premisas incorrectas y rechace solicitudes inapropiadas. ChatGPT es un modelo hermano de InstructGPT, que está capacitado para seguir una instrucción en un aviso y brindar una respuesta detallada.
Open AI

GPT3 es aún más grande

Y aunque ha estas alturas del post probablemente ya notaste que estamos fascinados con Chat GPT la verdad es que como un modelo de lenguaje e inteligencia artificial es más pequeño y consume menos recursos que su hermano mayor. GPT3, también desarrollado por OpenAI.

OpenAI

El Transformador Generativo Preentrenado 3 (GPT·3 ) es un modelo de lenguaje autorregresivo que utiliza el aprendizaje profundo para producir texto similar al humano. Dado un texto inicial como disparador o “Prompt” , producirá un texto que continúa al “prompt”.

Los transformadores recursivos y preentrenados tampoco son nuevos, toda herramientas capaz de detectar lenguaje como los auto correctores y textos predictivos funcionan a base de transformadores.

Lo que hace a GPT•3 impresionante es su arquitectura. Pues está formado por una red de transformadores estándar con un tamaño sin precedentes, -es simplemente gigantesco- de un contexto de 2048 tokens y 175 mil millones de parámetros que requieren 800 GB de almacenamiento y GPT•3 tiene trillones de Tokens. El método de entrenamiento es “preentrenamiento generativo”, lo que significa que está entrenado para predecir cuál es el próximo token. Los requisitos y recursos que necesita GPT•3 son igualmente enormes y sus costos de mantenimiento… bueno son exorbitantes Lo que lo hace aún no viable a nivel comercial. Mientras que Chat GPT es capaz de funcionar con una fracción de los costos y los recursos computacionales.

No solo eso ChatGPT es incluso capaz de funcionar sin conexión internet y es precisamente aquí cuando Google empieza a temblar pero ese es apenas el inicio de los problemas para Google.

Lenguaje Humanos vs Máquinas

Las máquinas y computadoras funcionan a base de algoritmos. Los algoritmos son procesos ordenados y lineales de resolución de problemas.

El cerebro y en especial el cerebro humano no es algorítmico (aunque sí binario) nuestro proceso de pensamiento es Heurístico, nosotros trabajamos a base de jerarquías y categorías. Nuestro cerebro desarrolló el lenguaje como un subproducto adaptativo para enfrentar los procesos evolutivos.

La verdad es que nuestro cerebro está solamente interesado en nuestra supervivencia y no en el lenguaje cómo tal, el lenguaje es solamente una herramienta que ha probado ser útil para extender la supervivencia y pasar los genes y cómo tal se ha aplicado recursivamente en las nuevas generaciones de humanos. Las computadoras no tienen este incentivo (aún) ellas no se preocupan por la comida de mañana o si serán desconectadas o no. Cómo tal los valores asociados a las palabras no encuentran un valor ni objetivo ni subjetivo en el mundo o en su preservación.

Aquí yace el primer gran obstáculo en enseñar a una red neuronal un idioma o un lenguaje humano. Y es que los humanos somos capaces de abstraer significados a niveles insospechados de manera instantánea, veamos por ejemplo la siguiente historia corta.

Las hormigas estaban en guerra, había que proteger el hormiguero y la reina a toda costa. Tras tres días de batalla el suelo empezó a temblar, en el horizonte una hormiga colosal, más grande de lo que ninguna hormiga roja había visto avanzaba sin parar. Las hormigas rojas pensaron que muy pocas aves si quiera se atreverían a intentar comerla.

Imagen 1
Imagen 2
Imagen 3
Imagen 4

Con la historia anterior usada como un prompt hemos creado 4 imágenes en Dall•E que también se basa en GPT3 para su procesamiento de imágenes. Puedes notar como Dalle•E también ha creado una historia basada en los análisis de millones de imágenes de internet que incluye Keywords o Tokens utilizados como referencia.

Por ejemplo utiliza el color rojo y sus variaciones como un elemento frecuente en la imagen si miras con atención puedes notar como este Token “rojo” se filtra y también es usado con frecuencia en los colores del fondo y el escenario. Esto corresponde a la manera de generación de imágenes a través de difusión. Como nuestro Prompt no incluía otro detalle sobre los colores de la escena Dall•E lo usa como una narrativa recursiva, para intentar lograr mayor exactitud en la generación de imágenes.

Dall•E también crea hormigas basado en su experiencia de aprendizaje Deep Learning, tras ver y transformar imágenes de hormigas en texto, creando así una referencia que como se ven las hormigas. También en 2 de las 4 imágenes es capaz diferenciar a la “hormiga colosal” con un tamaño muy superior a las otras hormigas en las imágenes. Y aunque nuestra historia no implica necesariamente la presencia de otras hormigas en las escena la tendencia de las imágenes reales y representaciones artísticas de incluir más de una hormiga debido a su comportamiento de colectivo, con las que GPT3 fue entrenada además de las palabras “Guerra” y“Hormigas” en plural hace que Dall•E infiera la presencia de varias hormigas.

Una hormiga puede ser grande, gigante o colosal y siempre seguir siendo minúscula comparada con un ave, un edificio o un planeta. Esta historia es capaz de generar imágenes en nuestro cerebro, que a su vez crea una narrativa visual con cohesión. Sin embargo incluso la tecnología GPT. No ve la narración como parte de un contexto mayor dónde debe de haber un cohesión. Sino que ve la historia como un todo absoluto. Es decir no utiliza experiencias previas, ni memoría genética para dar sentido al tamaño de la llamada “hormiga colosal”.

Esto es importante pues aquí es dónde ChatGPT es diferente, este Chatbot es capaz de recordar elementos previos de la conversación, reconocer errores e incluso cambiar de opinión. Y todo utilizando una narrativa y sintaxis bastante humana.

Natural Language Processing (NLP)

El Procesamiento del Lenguaje Natural (NLP) permite que las máquinas descompongan e interpreten el lenguaje humano. Es el núcleo y puente de las herramientas de escritura, texto y lenguaje que usamos todos los días, desde software de traducción, chatbots, filtros de spam y motores de búsqueda, hasta software de corrección gramatical, asistentes de voz y herramientas de monitoreo de redes sociales.

NLP analiza la estructura gramatical de las oraciones y el significado individual de las palabras, luego usa algoritmos para extraer el significado y entregar resultados. En otras palabras, da sentido al lenguaje humano para que el computador pueda realizar automáticamente diferentes tareas, acatar ordenes y generar resultados.

Probablemente, los ejemplos más populares de PNL en acción son los asistentes virtuales, como Google, Siri y Alexa. La NLP entiende textos escritos y hablados como “¡Ok Google! ¿Cuál es el restaurante más cerano?” y lo transforma en números para que la computadora lo pueda comprender.

Diferencias entre AI, ML y NLP

Inteligencia Artificial (AI) es un término general para las máquinas que pueden simular la inteligencia humana. La IA abarca sistemas que imitan las capacidades cognitivas, como aprender de ejemplos y resolver problemas. Esto cubre una amplia gama de aplicaciones como generación de imágenes a partir de texto, generación de texto a partir de imágenes e incluso vehículos con conducción autónoma.

El procesamiento del lenguaje natural (NLP) se ocupa de cómo las computadoras entienden y traducen el lenguaje humano. Con NLP, las máquinas pueden dar sentido al texto escrito o hablado y realizar tareas como traducción, extracción de palabras clave, clasificación de temas, entre otros.

Pero para automatizar estos procesos y brindar respuestas precisas, se necesita Machine Learning (ML). El aprendizaje automático o Aprendizaje de Máquina es el proceso de aplicar algoritmos que enseñan a las máquinas cómo aprender y mejorar automáticamente a partir de la experiencia sin haber sido necesariamente programadas explícitamente para resolver la tarea a la que se enfrentan.

Los chatbots impulsados por IA, por ejemplo, usan NLP para interpretar lo que dicen los usuarios y lo que pretenden hacer. Y utilizan ML para brindar automáticamente respuestas más precisas aprendiendo de interacciones pasadas.

Open AI y Microsoft.

Open AI se define como una organización sin fines de lucro enfocada en el desarrollo de Inteligencia Artificial y Redes Neuronales de alta capacidad. Esto implica que sus costos de operación son colosales en el rango de millones de dólares al año en servicios de procesamiento, servidores y salarios.

Además hay que recordar que no importa cuán maravillados estemos con los avances de estas herramientas de AI siguen siendo BETAS o versiones de pruebas y cuando se abren al público en versión de prueba se hace con la intención de someterlas a una prueba de presión a la vez que se recopilan datos del uso y el desempeño de las herramientas los Betas tienden a ser gratuitos o a costos minúsculos en relación al costo real de operación.

Entonces la pregunta que nace¿Cómo se financian entonces?

Hace aproximadamente dos años, Microsoft anunció una asociación con OpenAI, iniciando una estrecha relación comercial, para construir lo que el Microsoft llamó una “supercomputadora de IA” que se ejecuta en la nube de Azure. Con más de 285 000 núcleos de procesador y 10 000 tarjetas gráficas, Microsoft afirmó en ese momento que era uno de los grupos de supercomputadoras más grandes del mundo.

Dos años despúes y tras los resultados tan positivos de Open AI es seguro que Azure está soportando modelos y consumo de recursos aún pesados. Microsoft dice que ha firmado un acuerdo de “varios años” con Nvidia para construir una nueva supercomputadora alojada en Azure y alimentada por GPU, redes y software de IA de Nvidia para entrenar sistemas de IA.

Microsoft lleva años persiguiendo el mercadeo de buscadores web en dónde Google a reinado soberano indiscutido por varias décadas ya. Azure es comparable con servicios de alojamiento e infraestructura web como Amazon Web Services Y Google Cloud.

ChatGPT el arma no tan secreta de Microsoft.

Y aunque Microsoft es una de las empresas más importante en el mundo de la tecnología, ha quedado virtualmente fuera del varios de los mercados tecnológicos más importantes de la actualidad.

Telefonos celulares.

Hadware Móvil: tras el fracaso de su Windows Phone, Microsft le ha dejando espacio a competidores como Samsung, Huawei, Google y Apple para consolidarse en especial en el mercado de alta y media gama. No tener acceso a los dispositivos con los que la mayoría de usuarios navegan internet (teléfonos celulares) implica que Microsoft se está perdiendo de toneladas de información de uso y navegación de millones de personas.

Tienda Virtual.

La App Store tampoco ha logrado crear tiendas virtuales de importancia y es conocida por ser un lugar bastante solitario. Mientras que en los 90s y 00 la mayoría de programas se debían ejecutar de manera local y su instalador venía en CD’s dispositivos USB, la mayoría de software de uso masivo se ha mudado a Software online como servicio SaaS (Software as a Service). Esto implica que Microsoft no adquiere porcentajes o comisiones de las ventas y transacciones como si lo hacen Apple y Google con cada app alojada en sus tiendas virtuales.

Xbox y Video Juegos.

Ahora bien si hay un área en la que Microsoft si ha resultado ganadora ha sido en Video Juegos y Mercados Gamers tanto en computadoras como en consolas. Mientras que Apple es propietaria de cada uno de los componentes que van dentro de usos equipos Microsoft no desarrolla ni manufactura su propia Hardware, permitiendo que otras compañías inviertan millones en investigación y desarrollo de partes y componentes de equipos y computadoras.

Igualmente Xbox solo tiene competencia en Sonny y parcialmente Nintendo a la vez que ha sabido mudar su experiencia de juego, tanto para jugadores únicos como para multijugadores a la nueve servicios alojados en Azure.

Azure

Quizás una de las mayores fuentes de ingreso actuales de Microsoft. Microsoft Azure, anteriormente conocido como Windows Azure, es la plataforma informática y de servicios web en la nube pública de Microsoft. Proporciona una amplia gama de servicios en la nube, incluidos computación, análisis, almacenamiento, VPS, Cloud Hosting, Ciber Seguridad y otros servicios de redes.

BING

El de 3 de junio de 2009 Microsoft lanzó Bing su buscador en linea, con la intención de competir con Google por un mercado en el que estaba y quizás aún está solo. Y bueno a la fecha aún hay millones de personas que ni siquiera se han enterado que Bing existe, como buscador Bing es en realidad una excelente alternativa a Google, bastante menos invasivo y con menos publicidad, lo que hace más favorable su experiencia de usuario, pero también lo convierte en un activo de gran consumo de recursos para Microsoft y que aún está lejos de generar los ingresos de Google en términos de publicidad.

Sucede que Microsoft tiene un centenar de áreas dónde ChatGPT y Open AI podrían ofrecerle una ventaja gigantesca sobre sus competidores (esto asumiendo que sus competidores no se encuentra ya trabajando en tecnologías similares) Y aunque las finanzas de Microsoft son sólidas y la empresa no parece estar en ningún peligro de desaparecer en el futuro cercano. La ayuda de ChatGPT no le caería nada mal.

#KeywordSearch Volume
1facebook12,983,821
2youtube11,452,722
3google8,060,698
4gmail6,043,283
5bing homepage quiz5,578,736
6amazon4,838,409
7bing4,620,531
8news for you4,298,308
9yahoo3,746,439
10ebay3,428,642
11top stories3,403,727
12facebook log in3,201,621
13weekly quiz3,110,115
14yahoo mail2,720,281
15walmart1,988,367
16us news1,810,576
17fox news1,673,326
18bing weekly quiz1,634,519
19google maps1,569,468
20nfl1,566,064

En la tabla se muestran cuáles fueron los Keywords y Consultas. En Bing en 2021. Es notable de las 20 primeras consultas como las primeras 18 consultas de Bing son Navegacionales y solo 2 son Informacionales.

Las consultas navegacionales son las más difíciles de capitalizar mediante publicidad y también unas de las más complicadas para realizar optimización SEO. Además las primeras 4 llevan a motores de búsqueda en si mismos, es decir a la competencia directa de Bing.

Por supuesto de Microsoft misma debe de ser consiente de esta y otras realidades y debe de estar en sus objetivos armar cuanto antes a ChatGPT y algunos delos productos de Open AI ya sea mediante integración directa o mediante el uso de API’s.

ChatGPT y el futuro del SEO

Los profesionales SEO estudiamos de cerca el comportamiento y los cambios en los algoritmos de los motores de búsqueda y pasamos incontables horas en foros, noticias y discusiones de la comunidad además de utilizar herramientas avanzadas para desarrollar estrategias y campañas de optimización de motores de búsqueda. Es por eso en muchas páginas web exitosas se pueden notar patrones de comportamientos que reflejan las últimas tendencias que nos permiten “hackear el algoritmo”.

La capacidad de ChatGPT de entablar conversaciones complejas, recordar las conversaciones anteriores, corregir y revisar sus errores así como elaborar sobre sus respuestas previas tiene el potencial de cambiar el SEO tradicional para siempre. Para conocer más sobre esto te invitamos a visitar nuestro blog post ChatGPT vs Google.