[et_pb_section bb_built=»1″][et_pb_row][et_pb_column type=»4_4″][et_pb_text _builder_version=»3.13.1″]
Web scraping es una técnica para recopilar información de forma automática de la Web, a través de programas de software.
Regularmente, estos programas simulan la navegación de un humano en internet, ya sea utilizando el protocolo HTTP manualmente, o incrustando un navegador en una aplicación.
Se caracteriza por su capacidad para extraer información pública, este tipo de tecnología es muy ventajosa para cuestiones de investigación, ya sea por parte del gobierno, policía o detectives privados. Es un área con desarrollos activos, compartiendo un propósito en común con la visión de la Web semántica. Utiliza soluciones prácticas basadas en tecnologías existentes que son comúnmente ad hoc. Existen distintos niveles de automatización que las existentes tecnologías de Web Scraping pueden brindar:
Reconocimiento de información semántica, Protocolo HTTP, “Copiar y pegar” humano, algoritmos de minería de datos.
Existe gran cantidad de aplicaciones disponibles que pueden ser utilizadas para personalizar soluciones de Web Scraping. Estas aplicaciones podrían reconocer automáticamente la estructura de cierta página o brindar una interfaz al usuario donde este pudiera seleccionar los campos que son de interés dentro del documento.
El web scraping pudiera ir en contra de los términos legales de usanza de algunos sitios webs. El acatamiento de estos términos no está totalmente claro. Mientras que la duplicación de expresiones originales puede ser en muchos casos ilegal.
Estas y otras innovaciones ahora son posibles en Pharmamedic.
[/et_pb_text][/et_pb_column][/et_pb_row][/et_pb_section]