[et_pb_section bb_built=”1″][et_pb_row][et_pb_column type=”4_4″][et_pb_text _builder_version=”3.13.1″]

Il web scraping è una tecnica per raccogliere informazioni automaticamente dal Web, attraverso programmi software.

Regolarmente, questi programmi simulano la navigazione di un essere umano su Internet, usando il protocollo HTTP manualmente o incorporando un browser in un’applicazione.

È caratterizzato dalla sua capacità di estrarre informazioni pubbliche, questo tipo di tecnologia è molto vantaggioso per i problemi di ricerca, sia da parte del governo, della polizia o degli investigatori privati. È un’area con sviluppi attivi, che condividono uno scopo comune con la visione del Web semantico. Utilizza soluzioni pratiche basate su tecnologie esistenti che sono comunemente ad hoc. Esistono diversi livelli di automazione che le tecnologie Web Scraping esistenti possono fornire:

Riconoscimento di informazioni semantiche, protocollo HTTP, “Copia e incolla”, algoritmi di data mining umani.

Sono disponibili molte applicazioni che possono essere utilizzate per personalizzare le soluzioni di Web Scraping. Queste applicazioni potrebbero riconoscere automaticamente la struttura di una determinata pagina o fornire un’interfaccia all’utente in cui selezionare i campi di interesse all’interno del documento.

Il web scraping potrebbe andare contro i termini legali di utilizzo di alcuni siti web. Il rispetto di questi termini non è completamente chiaro. Mentre la duplicazione di espressioni originali può essere in molti casi illegale.

Queste e altre innovazioni sono ora possibili in Pharmamedic.

[/et_pb_text][/et_pb_column][/et_pb_row][/et_pb_section]