Zhipu AI presenta GLM-OCR: un modelo de OCR multimodal de 0,9 mil millones para análisis de documentos y extracción de información clave
Zhipu AI ha lanzado GLM-OCR, un modelo compacto de OCR multimodal diseñado para el análisis eficiente de documentos y la extracción de información clave, que presenta un codificador CogViT de 0,4 mil millones y un decodificador GLM de 0,5 mil millones, con mejoras significativas en el rendimiento y las capacidades de salida estructurada.
Detalles
Zhipu AI ha lanzado GLM-OCR, un modelo compacto de OCR multimodal diseñado para el análisis eficiente de documentos y la extracción de información clave, que presenta un codificador CogViT de 0,4 mil millones y un decodificador GLM de 0,5 mil millones, con mejoras significativas en el rendimiento y las capacidades de salida estructurada.
Esta noticia forma parte del flujo diario de noticias de IA de NewsCube. La página de detalle mantiene el resumen principal fácil de escanear y muestra los enlaces a las fuentes originales para verificar la información y profundizar.
Usa la lista de fuentes para ir directamente al reportaje original, a la página del producto, al repositorio o al material de referencia detrás de esta noticia.