martes, 11 de diciembre de 2012

Batua – Recuperación y extracción de contenido de Internet.


Internet es la fuente más rica y variada de datos. Sin embargo, el acceso a éstos escapa muchas veces a los mecanismos de extracción tradicionales. Para eliminar dicho inconveniente creamos Batua, un producto que utiliza las más recientes técnicas de extracción automática, masiva y continua de contenido de la Web, permitiendo hacer diferencia a la hora de incrementar y potenciar el negocio. 
La web ya es parte de nuestras vidas, cada vez encontramos más información en ella: las empresas vuelcan las características de sus productos, precios y lugares; las personas recomiendan, comentan y opinan de servicios, productos, o simples sensaciones de sus vidas. Por estos y muchos otros motivos, Internet se ha transformado en el nuevo y poco explorado gigante repositorio de información. La cantidad que dispone de ella es enorme y la forma en que se encuentra escrita, muy variada, ocasionando que para su recolección y explotación, las empresas necesiten una herramienta que los ayude a realizarlo en forma automatizada y masiva. 
Batua (Web Crawling and Scrapping) es una plataforma que a partir de un listado de sitios que uno considere relevantes para su negocio se focaliza en extraer sólo la información que uno necesite en forma metódica y automatizada, con la capacidad de aprender y adaptarse a los distintos cambios. Es así como uno puede contar con nueva información rápida, eficiente y continuamente actualizada. 
Entre sus beneficios directos podemos destacar la potencial integración de los datos recolectados de la web a otros sistemas para así poder realizar el análisis de mercado en mucho menor tiempo. Además, al sumar Web Mining se minimizan los costos de investigación automatizando las búsquedas en Internet, reduciendo los tiempos de filtrado de información relevante y contando instantáneamente, con nueva y valiosa información estructurada ahora en nuestras bases de datos e integrable a cualquier otro sistema. 
Como ejemplo práctico, si para nuestro negocio consideramos clave contar con los avisos clasificados de un sitio A y listados de productos de un sitio B, podremos realizar un seguimiento constante de las bases de datos de estos sitios. Contaremos con nueva y valiosa información como así también, con evoluciones en el tiempo de avisos o listados de productos, permitiéndonos enfocar nuestro esfuerzo en el análisis y detectar a modo de ejemplo, diferentes momentos o épocas, cantidad de nuevos avisos, o avisos eliminados por fecha para analizar y así aplicar decisiones claves de negocio. 
La minería web o Web Mining en vez de limitarse a recolectar información estructurada en forma de campos, origina una nueva y novedosa posibilidad al recolectar oraciones o párrafos para luego interpretar estos textos con PNL (procesamiento de lenguaje natural), IR (recuperación de información) y otros tipos de algoritmos de análisis inteligente de textos o inteligencia artificial. 
Batua da un enorme valor agregado al ser totalmente parametrizable y ajustarse a sus necesidades únicas. Es capaz de absorber información de sitios públicos o privados ajustando las búsquedas a las necesidades del cliente. Nuestra herramienta no sólo recupera textos sino que también, extrae imágenes o videos para image-recognition, o utiliza OCRs para la digitalización de textos. 
Fiel a los objetivos que seguimos en 7PuentesBatua no es un producto más; es una herramienta versátil, eficiente, con un alto valor agregado, cuyo objetivo es dar a los clientes acceso a información fundamental para la toma de decisiones.
                                                                                              Lic. Leonel Marino

No hay comentarios:

Publicar un comentario