Contáctenos

Unir.AI

Kunal Kejriwal

"Ingeniero de profesión, escritor de corazón". Kunal es un escritor técnico con un profundo amor y comprensión de AI y ML, dedicado a simplificar conceptos complejos en estos campos a través de su atractiva e informativa documentación.

Inteligencia Artificial Enero 19, 2026

Introducción a Vertex AI

Dado el panorama en rápida evolución de la Inteligencia Artificial, uno de los mayores obstáculos que suelen encontrar los líderes tecnológicos es la transición de ser “experimentales” a estar “preparados para la empresa”...
Inteligencia Artificial 11 de Octubre de 2024

SHOW-O: Un transformador único que une la comprensión y la generación multimodal

Los avances significativos en los modelos de lenguaje grandes (LLM) han inspirado el desarrollo de modelos de lenguaje grandes multimodales (MLLM). Los primeros esfuerzos de MLLM, como LLaVA, MiniGPT-4 e InstructBLIP,...
Inteligencia Artificial 10 de Septiembre de 2024

EAGLE: Explorando el espacio de diseño para modelos de lenguaje multimodales de gran tamaño con una combinación de codificadores

La capacidad de interpretar con precisión información visual compleja es un objetivo fundamental de los modelos multimodales de lenguaje extenso (MLLM). Trabajos recientes muestran que una percepción visual mejorada...
Inteligencia Artificial 9 de Septiembre de 2024

Sapiens: Fundación para los modelos de visión humana

El notable éxito del preentrenamiento a gran escala seguido de un ajuste fino específico para cada tarea para el modelado del lenguaje ha establecido este enfoque como una práctica estándar. De manera similar, los métodos de visión artificial son...
Inteligencia Artificial 21 de agosto de 2024

LongWriter: Liberando la generación de más de 10,000 palabras a partir de LLM de contexto largo

Los modelos de lenguajes grandes (LLM) de contexto largo actuales pueden procesar entradas de hasta 100,000 tokens, pero tienen dificultades para generar resultados que excedan incluso una longitud modesta de 2,000...
Inteligencia Artificial 6 de agosto de 2024

SGLang: ejecución eficiente de programas modelo de lenguaje estructurado

Los modelos de lenguaje grande (LLM) se utilizan cada vez más para tareas complejas que requieren llamadas de múltiples generaciones, técnicas de indicaciones avanzadas, flujo de control y entradas/salidas estructuradas. Sin embargo, los sistemas eficientes para...
Inteligencia Artificial 29 Julio 2024

MINT-1T: Ampliar datos multimodales de código abierto 10 veces

El entrenamiento de grandes modelos multimodales (LMM) de frontera requiere conjuntos de datos a gran escala con secuencias entrelazadas de imágenes y texto en forma libre. Aunque los LMM de código abierto han evolucionado rápidamente, hay...
Inteligencia Artificial 16 Julio 2024

DIAMANTE: Los detalles visuales importan en Atari y la difusión para el modelado mundial

Fue en 2018, cuando se introdujo por primera vez la idea del aprendizaje por refuerzo en el contexto de un modelo mundial de redes neuronales, y pronto, este fundamental...
Inteligencia Artificial 15 Julio 2024

In-Paint3D: Generación de imágenes utilizando modelos de difusión sin rayos

La llegada de modelos de IA generativa profunda ha acelerado significativamente el desarrollo de la IA con capacidades notables en generación de lenguaje natural, generación 3D, generación de imágenes y...
Inteligencia Artificial 9 Julio 2024

MARKLLM: un conjunto de herramientas de código abierto para marcas de agua LLM

La marca de agua LLM, que integra señales imperceptibles pero detectables dentro de los resultados del modelo para identificar el texto generado por los LLM, es vital para prevenir el uso indebido de lenguaje extenso...
Inteligencia Artificial 14 de Junio de 2024

MoRA: Actualización de alto rango para un ajuste fino de parámetros eficiente

Debido a su sólido rendimiento y amplia aplicabilidad en comparación con otros métodos, LoRA o adaptación de bajo rango es uno de los PEFT o parámetros más populares...
Inteligencia Artificial 11 de Junio de 2024

LightAutoML: solución AutoML para un gran ecosistema de servicios financieros

Aunque AutoML ganó popularidad hace unos años, los primeros trabajos sobre AutoML se remontan a principios de los años 90, cuando los científicos publicaron los primeros artículos...
Inteligencia Artificial 6 de Junio de 2024

LLaVA-UHD: un LMM que percibe cualquier relación de aspecto e imágenes de alta resolución

El reciente progreso y avance de los modelos de lenguaje grandes ha experimentado un aumento significativo en las capacidades de interacción, comprensión y razonamiento visión-lenguaje. Los marcos modernos logran esto mediante...
Inteligencia Artificial 31 de Mayo de 2024

Uni-MoE: Ampliación de LLM multimodales unificados con una combinación de expertos

Los avances recientes en la arquitectura y el rendimiento de los modelos de lenguaje grande multimodal o MLLM han puesto de relieve la importancia de los datos y modelos escalables para mejorar...
Inteligencia Artificial 24 de Mayo de 2024

MambaOut: ¿Realmente necesitamos a Mamba para la visión?

En los marcos modernos de aprendizaje automático e inteligencia artificial, los transformadores son uno de los componentes más utilizados en varios dominios, incluida la serie GPT y BERT en...

Más Artículos

Página 1 de 612 3 4 5 6