#RecapIA 29 - Perplexity AI Phone · Gemini · ChatGPT 4.5 · Sesame AI · Dragon Copilot
????Te damos la bienvenida a la newsletter de IA de Interacso! Lo que necesitas saber semanalmente para estar al día
?? Si eres C-Level, quieres formar parte de nuestra comunidad de discusión hay un acceso al final de esta publicación
Antes de comenzar a leer no te pierdas la recopilación que hace nuestro avatar en menos de 1 minuto.
Tiempo de lectura: 5 minutos
Lo más relevante de la IA esta semana
??Las noticias más relevantes de la semana.
??Herramientas de la semana: Motion Prediction, Scribe, Octave, Flora AI, Pika 2.2, Ideogram 2a, Alexa+, Granite 3.2, Aria Gen 2, Avatares de Meta, Phi 4 multimodal y Phi 4 mini, Mercury, ARI, Gemini en Google Sheets, Operator y El Sevilla FC esta usando IA.
Estas son las noticias más relevantes de la semana:
El primer móvil impulsado por inteligencia artificial, el fin de las apps
Durante el Mobile World Congress 2025 en Barcelona, Deutsche Telekom, la empresa matriz de T-Mobile, anunció el lanzamiento de su “AI Phone”, que funcionará con “Perplexity Assistant”. Los smartphones dejarán de funcionar con aplicaciones para ser controlados únicamente por tu voz. La IA escucha, entiende y actúa en función de lo que le pidas en lo que parece ser el fin de las “apps stores”. Este lanzamiento se espera para la segunda mitad de este a?o, y sin duda, nos acerca a un futuro con smartphones más inteligentes y fáciles de usar.
Gemini lanza una nueva función que podría revolucionar el comercio electrónico
Ahora [Gemini](https://techcrunch.com/2025/03/03/googles-gemini-now-lets-you-ask-questions-using-videos-or-whats-on-your-screen/#:~:text=AI-,Google's Gemini now lets you ask questions,and what's on your screen&text=Google is adding new features,the screen in real time.) es capaz de analizar en tiempo real lo que aparece en la pantalla de tu dispositivo. Durante el MWC 2025, Google mostró cómo Gemini puede responder a preguntas basadas en lo que ves, haciendo que la interacción entre el usuario y el modelo sea más directa e intuitiva. Imagina adaptar este modelo a tu tienda online y que tus clientes puedan hacer preguntas sobre lo que quieren comprar o grabar un video y hacer búsquedas sobre su contenido. Estas mejoras estarán disponibles próximamente para los usuarios de Gemini con el plan Google One AI Premium.
El asistente de los profesionales de la medicina de Microsoft
Microsoft está haciendo una fuerte apuesta en la medicina con su nuevo asistente Dragon Copilot. El modelo escucha las conversaciones entre el doctor y el paciente y, automáticamente, escribe las notas médicas, busca información relacionada y organiza otras tareas administrativas. Todo para que profesionales de la medicina puedan dedicar más tiempo a sus pacientes. Ahorra alrededor de cinco minutos por consulta, reduce el agotamiento de profesionales de la medicina en un 70% y el 93% de los pacientes reporta una mejor experiencia. Dragon Copilot se lanzará en Estados Unidos y Canadá en mayo.
OpenAI presenta su modelo más natural y Sesame habla como si fuera una persona
OpenAI ha lanzado ChatGPT 4.5, su versión más avanzada hasta ahora. Esta actualización hace que la IA se sienta más natural y “humana”. Esto se debe a la mejora en sus capacidades de comprensión, reconocimiento de emociones y matices en la conversación, entiende mejor lo que el usuario realmente quiere decir y ofrece respuestas más claras, precisas y fluidas. Además, GPT?4.5 es mejor en tareas creativas como escribir, programar y resolver problemas, reduciendo notablemente los errores o “alucinaciones”.
Te dejamos la leaderboard con los 10 primeros puestos, GPT 4.5 ocupando el segundo lugar:
Mira la leaderboard completa aquí.
Además ?Sesame Conversational Speec Model está trabajando en un modelo que habla de forma más natural y expresiva, como si fuera una persona. Te recomendamos que la pruebes porque suena muy real. Aprende a entender el contexto de la conversación para ajustar su tono de voz y ritmo al hablar.
Claude 3.7 apuesta por la IA en la educación
Claude 3.7 ha creado un vídeo explicativo para la universidad de Tokio usando animaciones para hacer que los conceptos o términos complejos sean más fáciles de entender. En este caso la AI ha simplificado temas avanzados de matemáticas. Son peque?as muestras que nos dan una idea de cómo la IA podría transformar el mundo educativo en un futuro cercano.
Te dejamos el vídeo ????
Herramientas de la semana
Cada semana te traemos lo más nuevo y relevante.
???Herramientas creativas
1???Wonder Dynamics lanzan "Motion Prediction" - Captura los movimientos de una persona un video, incluso si está oculta detrás de objetos.
?Por qué es importante? Reduce el trabajo de los animadores y permite crear animaciones más realistas y naturales.
2???ElevenLabs ha creado Scribe - Transcribe audio a texto en 99 idiomas diferentes, identificando quién está hablando, poniendo marcas de tiempo en cada palabra y detectando sonidos como risas.
3???Hume AI ha creado Octave - Permite crear voces a partir de descripciones de texto, que entienden el significado detrás de las palabras y su contexto dentro del guion. Esto significa que puede sonar triste, feliz, enojado o cualquier otra emoción.
4???Flora AI - Un lienzo inteligente que te ayuda a crear imágenes, videos y textos usando diferentes herramientas de inteligencia artificial, todo en un solo lugar.
5???Pika 2.2 - Nuevas generaciones de 10s, mejor resolución y “Pikaframes”, que permite transiciones entre dos fotogramas de 1-10s.
7???Ideogram 2a - Modelo de conversión de texto a imagen más rápido y asequible hasta la fecha, optimizado para el dise?o gráfico y la fotografía. Ya está disponible para todos los usuarios.
???Modelos avanzados
2???Amazon está lanzando Alexa+ - Puede navegar por internet por ti o recordarte cosas importantes. También aprende de tus gustos y preferencias para darte sugerencias personalizadas. Estará disponible en dispositivos Echo, app para el celular y en la web de Alexa.
3???IBM ha lanzado Granite 3.2 - Nueva familia de IAs de código abierto que pueden hacer más que solo entender el lenguaje. Granite 3.2 incluye modelos que pueden razonar mejor (como pensar paso a paso para resolver problemas) y hasta "ver" imágenes y entender documentos.
4???Meta ha lanzado Aria Gen 2 - Gafas especiales para investigadores que quieren entender mejor cómo las personas ven y entienden el mundo.
5???Meta presenta nueva tecnología para crear avatares realistas- Esta tecnología es capaz de generar avatares realistas en 3D detallado de tu cara a partir de solo cuatro selfies.
6???Microsoft a lanza Phi 4 multimodal y Phi 4 mini - Phi 4 multimodal combina voz, imágenes y texto al mismo tiempo para lograr interacciones más naturales y Phi 4 mini se centra en tareas de texto como escribir y programar. Estos funcionan en dispositivos peque?os, como teléfonos.
???Productividad y desarrollo
1???Inception Labs ha creado Mercury - Una nueva IA que genera texto y código mucho más rápido que las IA tradicionales, hasta 10 veces más rápido.
2???You.com ha lanzado ARI - Puede analizar hasta 400 fuentes de información al mismo tiempo y escribir un informe completo con gráficos y fuentes verificables en solo 5 minutos.
4???Google ha a?adido nuevas funciones de Gemini a Google Sheets - Ahora, Sheets puede ayudarte a crear tablas de forma automática, organizar datos y obtener información importante más fácilmente.
5???Opera lanza su navegador llamado "Operator" - Ayuda a navegar en internet en tiempo real de forma más fácil. Puedes pedirle a Operator que busque información, compare precios, resuma páginas web o incluso que realiza acciones por ti, como llenar formularios.
?? Deportes e IA
1???El Sevilla FC esta usando IA - El equipo de fútbol usa una nueva IA llamada Scout Advisor para encontrar jugadores talentosos más rápido. Esta IA, construida con IBM watsonx y Llama 3.1, analiza montones de informes de ojeadores (personas que buscan jugadores) y te da un resumen rápido del jugador que te interesa. Antes, se tardaban horas en analizar los informes, pero ahora la IA lo hace en segundos.
AI4Bizz
Agentes de voz transforma la atención al cliente en la banca
La inteligencia artificial por voz ha alcanzado un nivel de desarrollo muy alto, como consecuencia, un sector con un marco regulatorio tan estricto como el de la banca, ha ido adquiriendo sus capacidades en lo relativo a la atención del cliente. Los agentes de voz ya pueden atender llamadas en cualquier horario y comunicarse en el idioma preferido de sus clientes. Incluso pueden tener el historial del cliente y recordarlo en cada llamada.
Para que estos sea posible, es necesario que los agentes puedan acogerse a los requisitos normativos del sector, necesitarán navegar y acceder a los datos de diferentes sistemas y tener un conocimiento profundo del sector y los servicios.
Te dejamos el artículo por si quieres leerlo ????
?Esperamos que hayas disfrutado de la edición de hoy! Si ha sido así, déjanos un comentario contándonos cuál ha sido la noticia que más te ha sorprendido y… ?crees que las interacciones con nuestros dispositivos cambiarán en el futuro? No olvides compartir y suscribirte. ?Anímate!
?? Si eres C-level y quieres compartir conocimiento. Hemos creado la comunidad 2BrAIn, encontrarás conocimiento, experiencias y personas dispuestas a enriquecer tu toma de decisiones. Si quieres formar parte solicita acceso a través del link y ?únete!
? Si necesitas acompa?amiento en tu camino de adopción de la IA. Acabamos de lanzar AI Sherpa, un servicio para guiar a las empresas desde la inspiración hasta la implementación.