Ahora Google también hace OCR a los PDFs8 de Noviembre de 2008 — Manuel Delgado
Esto se traduce en un beneficio evidente para los usuarios de Google: poder acceder a multitud de documentos que, hasta ahora, eran muy difÃciles de encontrar porque el motor de búsqueda sólo sabÃa de ellos lo que le indicaban los vÃnculos que habÃa hacia ellos y poco más. Pero, además, creo que Google tiene, de manera accesoria, un nuevo servicio que ofrecer a sus usuarios: la posibilidad de hacer OCR bajo demanda de los documentos que necesitemos interpretar. Este servicio podrÃa ofrecerse de forma independiente o integrado en otros como GMail o Google Docs. La tecnologÃa OCR tuvo una época de crecimiento y mejora a finales de los noventa y principios de esta década pero, tras eso, podrÃamos decir que está relativamente estancada. Los mejores motores de OCR, que no se limitan a la mera interpretación de la imagen analizada sino que se apoyan también en decisiones probabilÃsticas, diccionarios, etc., no llegan aún a un 100% de precisión, ni siquiera en condiciones ideales. Este movimiento de Google tiene, por tanto, otra perspectiva interesante: Google va a someter a su motor de OCR a una baterÃa de pruebas de tamaño inmenso, formada por todos los PDFs de ese tipo que encuentre en Internet. Si lo manejan bien, eso les va a permitir afinar, mejorar y optimizar su motor de OCR hasta niveles nunca imaginados hasta la fecha, asà que quién sabe si no estamos ante el nacimiento del “motor de OCR definitivo”. Haga un comentario |
Suscríbete
cargando...
Últimos artículosÚltimos comentariosFuentes compartidas en Google Reader
|
Nube de etiquetasAeropuertos apple blogs burocracia cambio canon digital CDL Centro Democrático Liberal chapuzas crisis datos personales derechos derechos de autor economÃa elecciones El PaÃs empresas España Estados Unidos Evaluaciones gestión del cambio gestión del conocimiento Gestión empresarial Google humor impuestos Informática información Internet justicia leyes liberalismo libertad Libros literatura Música Manuel Delgado metodologÃas Microsoft negocios Parlamento Europeo Partido Popular periodismo PolÃtica pp privacidad propiedad intelectual PSOE Schneier seguridad SGAE software tecnologÃa teléfonos móviles terrorismo tráfico viajes Web 2.0 WordPress zapatero Recomendaciones al azarHistórico de artículosVínculos recomendadosAnclaos | Antonio Andújar | Antonio España | Centro Democrático Liberal | Desde el Exilio | Desde la Concha | Doce Doce | El blog de Luis Margol | El Joven Centrista | In partibus infidelium | Javier Capitán | Lumen Dei | Malaprensa | Mensa España | Ningunterra | Proyecto Seléucida | Schneier on Security | Siracusa 2.0 | Sobre la LÃnea | Spanish Pundit | The Dilbert Blog | Wonkapistas | |




