es.wedoany.com Noticia: SenseTime está desarrollando en secreto un modelo multimodal de gran escala llamado "U1 Pro", liderado por el cofundador y científico jefe Lin Dahua. Este modelo está orientado principalmente a escenarios de "diseño", con el objetivo de crear un modelo de generación de imágenes con capacidad de razonamiento que compita con GPT-Image 2 de OpenAI.
El modelo, impulsado por el Instituto de Investigación de SenseTime, pertenece a la familia de modelos SenseNova de la empresa. Se espera que en julio de este año se inicien las pruebas internas por invitación y se ofrezca servicio a los clientes. Según fuentes cercanas, "U1 Pro" puede, ante necesidades de diseño complejas, actuar como un "diseñador que piensa", logrando un ciclo prolongado de diseño, generación y revisión, y admite salida en resolución 8K. En numerosas evaluaciones internas, bajo las mismas indicaciones, las imágenes generadas por "U1 Pro" son muy similares a las de GPT-Image 2, e incluso presentan ventajas.
En la puntuación de generación de texto a imagen de LMSYS Chatbot Arena, GPT-Image 2 supera ampliamente a Nano Banana 2 de Google en calidad de imagen, renderizado de texto y cumplimiento de instrucciones, lo que ha generado una gran demanda en la industria del diseño. Se prevé ampliamente que OpenAI también lanzará pronto un nuevo modelo de generación de imágenes por IA, centrando sus esfuerzos en el "diseño".
La filtración del nuevo modelo "U1" de SenseTime envía una señal al exterior: más allá de la programación liderada por empresas de IA de primer nivel como Anthropic y Zhipu, el "diseño" se está convirtiendo en el próximo campo principal de competencia para los modelos multimodales.
Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com









