Web Data

Istella ha sviluppato un motore di ricerca B2C, investendo sulla creazione di una delle più grandi infrastrutture Big Data in Europa. Ciò consente la scansione e l’elaborazione di centinaia di milioni di documenti al giorno, nonché la possibilità di rigenerare gli indici, gli algoritmi di classificazione e di machine learning in minor tempo rispetto alla maggior parte dei concorrenti.

La piattaforma che continuiamo a gestire per il web crawling, analizza e elabora oltre 7 miliardi di documenti (pagine web, interazioni di social network, video, immagini, notizie, ecc.). È un dataset unico nel suo genere di dati che offriamo per arricchire i dati dei nostri clienti e questo ci consente di avere dei prodotti e dei servizi di data intelligence di impareggiabile utilità:

7 miliardi di URL indicizzati;

400 segnali estratti;

più di 15 miliardi di URL rilevati;

100 milioni di URL aggiornati quotidianamente;

2000 feed RSS aggiornati ogni 10 minuti;

1500 siti di notizie aggiornati ogni 10 minuti.