julio 2, 2024

CubaComunica

Spanish News Today para obtener las últimas noticias, estilo de vida y información turística en inglés en España.

¿Qué funciones de IA de Gemini y Google estamos esperando?

¿Qué funciones de IA de Gemini y Google estamos esperando?

Durante el último año, Google presentó una vista previa de una serie de funciones de inteligencia artificial de la marca Gemini en sus aplicaciones orientadas al consumidor. Aquí está todo lo que se ha anunciado y cuándo podría estar disponible.

píxel

Al final de Made by Google 2023, se mostró una función de mejora de zoom que “rellena de forma inteligente los espacios entre píxeles y predice detalles finos” para el Pixel 8 Pro. Aprovechando el “modelo de imagen de IA generativa personalizado” en el dispositivo, Google lo presentó como útil cuando te olvidas de hacer zoom.

Es una increíble aplicación de IA generativa que abre una gran cantidad de posibilidades para enmarcar y editar tus fotos. Entonces, el tipo de optimización del zoom que estás acostumbrado a ver en la ciencia ficción: directamente en el teléfono que tienes en la mano.

En octubre, Google dijo que esto «llegaría más tarde». Después de tres caídas de funciones de Pixel, todavía no han llegado. No está claro si el modelo al que se refiere Google es el Gemini Nano con Multimodalidad. En este punto, puede debutar con el Pixel 9 Pro como la función fotográfica principal de ese teléfono.

Casa de Google

En la aplicación Google Home, se utilizará IA generativa para resumir los eventos en una «vista simplificada de lo que sucedió recientemente». Este resumen rápido y sencillo utilizará viñetas resumidas, mientras que también podrá «Preguntar sobre su casa» en forma conversacional para encontrar videos históricos y automatizarlo. Las “funciones beta” estarán disponibles para los suscriptores de Nest Aware en 2024.

Fitbit

Fitbit Labs permitirá a los usuarios de Fitbit Premium probar capacidades experimentales de IA y proporcionar comentarios sobre ellas.

Una de esas características es un chatbot que te permite hacer preguntas sobre tus datos de Fitbit de forma natural y conversacional. Este “entrenamiento personalizado” con objetivos de acondicionamiento físico en mente tiene como objetivo crear “mensajes y orientación prácticos”, con respuestas que pueden incluir gráficos personalizados.

  • «Por ejemplo, puedes profundizar en cuántos minutos de zona activa (AZM) estás obteniendo y correlacionarlos con qué tan bien recuperas tu sueño».
  • «…Este modelo puede analizar las diferencias en sus patrones y calidad de sueño, y luego sugerir recomendaciones sobre cómo cambiar la intensidad de su ejercicio en función de esos conocimientos».

Detrás de escena, esta aplicación funciona con Fitbit y el nuevo software Personal Health LLM de Google Research creado sobre Gemini. A partir de marzo, se lanzará «más adelante este año» para «un número limitado de usuarios de Android inscritos en el programa Fitbit Labs en la aplicación móvil de Fitbit».

imágenes de google

La función Preguntar fotos le permite hacer preguntas sobre fotos y videos en su biblioteca. A diferencia de la búsqueda de imágenes, puede extraer información y brindarle una respuesta de texto. Las consultas impulsadas por Géminis incluyen «Muéstrame la mejor foto de cada parque nacional en el que hayas estado» y «¿Qué temas cubrimos en las fiestas de cumpleaños de Lena?» Se pueden utilizar para «sugerir las mejores fotos» y crear títulos para ellas. Ask Photos es una “función beta” que se lanzará pronto, y Google ya insinúa más capacidades en el futuro.

Gmail + espacio de trabajo de Google

En la aplicación Gmail para Android e iOS, encontrarás un botón Gemini en la esquina superior derecha que te permite abrir el equivalente móvil de un panel lateral para ingresar instrucciones completas. Gmail también recibe respuestas inteligentes contextuales que ofrecen sugerencias más personalizadas, detalladas y precisas. Esta función se lanzará en Workspace Labs en julio.

READ  El director de Overwatch admite que el desarrollador ha defraudado a la comunidad del juego

En Cloud Next 2024 en abril, Google también presentó una vista previa de una capacidad de mensajes de voz para ayudarme a escribir en Gmail para dispositivos móviles. Mientras tanto, la función Instant Polish «convierte notas preliminares en un correo electrónico completo con un solo clic».

En la web de escritorio, el panel lateral está disponible en Gmail, Google Drive y Docs/Sheets/Slide. Luego, Gemini acudirá al chat de Google para resumir las conversaciones y responder preguntas.

mapas de Google

En febrero pasado, Google anunció que Maps utilizaría LLM para impulsar su chatbot Ask About. Puede usarlo para encontrar lugares que coincidan con su reclamo con soporte para preguntas de seguimiento. Está impulsado por detalles sobre 250 millones de lugares, fotos, vídeos y reseñas enviados por usuarios.

cromo

Gemini Nano llega al navegador de escritorio Chrome para potenciar funciones del navegador como Help Me Typing. Debería estar disponible en la mayoría de las computadoras portátiles y de escritorio modernas.

Junto con el lanzamiento de AI Overviews, Google ha presentado una vista previa de una serie de funciones próximas que llegarán por primera vez a Search Labs:

  • Podrá tomar una descripción general original de la IA y hacerla «más simple» (solo unas pocas oraciones) o «desglosarla» (respuesta más larga).
  • Las capacidades de razonamiento de varios pasos le permiten formular una pregunta compleja de una sola vez en lugar de dividirla en varias consultas.
  • Planificación de comidas y viajes.
  • Página de resultados de búsqueda organizada por IA
  • Búsquedas de vídeos: graba un vídeo y haz una pregunta al respecto.

Androide

Gemini Nano se lanzará con multimodalidad en el Pixel «más adelante este año» y funciones potentes como descripciones TalkBack en el dispositivo/fuera de línea y alertas de fraude en tiempo real que escuchan una llamada para detectar patrones reveladores. Google compartirá más detalles a finales de este año.

En I/O 2024, Google también mostró una vista previa de cómo Gemini en Android pronto se convertirá en un panel superpuesto en lugar de abrir una interfaz de usuario en pantalla completa para mostrar los resultados. Además de mantener el contexto, esto te permitirá arrastrar y soltar la imagen generada en la conversación. Para los suscriptores de Gemini Advanced, los botones “Preguntar a este video” y “Preguntar a este PDF” verán videos y documentos de Gemini, respectivamente. Esto se implementará “durante los próximos meses”. Además, utilizará las sugerencias dinámicas de Gemini Nano con multimedia para comprender lo que hay en su pantalla:

Por ejemplo, si involucras a Géminis en una conversación sobre pickleball, las sugerencias pueden incluir «Encontrar clubes de pickleball cerca de mí» y «Reglas de pickleball para principiantes».

Otro añadido que resultará especialmente útil en dispositivos móviles son las extensiones Gemini para Google Calendar, Google Tasks y Keep. Este complemento te permitirá tomar una foto de una página que contenga varias fechas próximas y Gemini podrá convertirlas en eventos del calendario. En los próximos meses, la función «Utilidades» de la aplicación móvil Gemini permitirá el acceso a la aplicación Reloj en Android.

READ  Google detalla las aplicaciones que ofrecerán Spatial Audio en Pixel, Buds Pro

También estamos esperando que llegue la aplicación móvil Gemini a la tableta Pixel este verano.

mellizo

La aplicación Live te permitirá tener una conversación bidireccional con tu Géminis. Para que la experiencia sea más natural, la aplicación Gemini te enviará breves respuestas que podrás interrumpir para agregar nueva información o pedir una aclaración. Puede elegir entre 10 voces diferentes, y Google prevé que la aplicación Gemini Live sea útil para prepararse para una entrevista o practicar cómo dar un discurso. Estará disponible en los “próximos meses” para los miembros de Gemini Advanced.

A finales de este año, la aplicación Gemini Live te permitirá activar el modo de cámara en vivo. Simplemente señale algo en el mundo real y haga una pregunta al respecto. Esto se hace a través del Proyecto Astra.

Las gemas son versiones personalizadas de Gemini que te permiten tener un “compañero de gimnasio, un segundo chef, un socio de programación o un mentor de escritura creativa”. Los miembros de Gemini Advanced podrán crear gemas personalizadas, mientras que todos los usuarios tendrán acceso a gemas ya preparadas, como el Learning Coach.

Simplemente describe lo que quieres que haga tu núcleo y cómo quieres que responda, como por ejemplo: «Tú eres mi entrenador de carrera, dame un plan de carrera diario y sé positivo, optimista y motivado». Gemini tomará estas instrucciones y, con un clic, las mejorará para crear una gema que satisfaga sus necesidades específicas.

Los usuarios de Gemini Advanced también obtendrán un «planificador integral» que va más allá de simplemente sugerir actividades, sino que tiene en cuenta los tiempos de viaje y las paradas, así como los intereses de las personas, para crear un itinerario detallado. Gemini utilizará los detalles de su vuelo/viaje de Gmail, las recomendaciones de Google Maps sobre comida y museos cerca de su hotel y buscará otras actividades.