Fr. 102.00

M. Lavanya

Estrazione dei dati del web profondo basata sulla visione per il raggruppamento dei documenti web - Questo lavoro propone un approccio all'estrazione di dati web profondi basato sulla visione per il clustering dei documenti web (VDEC)

Italian · Paperback / Softback

Shipping usually within 2 to 3 weeks (title will be printed to order)

Description

L'approccio VDEC comprende due fasi: 1) estrazione dei dati web basata sulla visione e 2) raggruppamento dei documenti web. Nella fase 1, le informazioni della pagina Web vengono segmentate in vari chunk, dai quali vengono rimossi il rumore in eccesso e i chunk duplicati utilizzando tre parametri, quali la percentuale di collegamenti ipertestuali, il punteggio del rumore e la somiglianza del coseno. Per identificare i chunk rilevanti, vengono utilizzati tre parametri, quali la rilevanza del titolo, la selezione dei chunk basata sulla frequenza delle parole chiave e le caratteristiche della posizione, per poi estrarre un insieme di parole chiave da questi chunk principali. Infine, le parole chiave estratte vengono sottoposte a clustering dei documenti web utilizzando il Fuzzy C-Means clustering (FCM). L'estrazione di dati web profondi basata sulla visione proposta è stata implementata e testata utilizzando un set di dati sintetici. I risultati sono stati confrontati con i due algoritmi esistenti, il ViDE (Vision-based Data Record Extraction) e l'MDR (Mining Data Region). Dai risultati sperimentali eseguiti su due diversi set di dati sintetici, è emerso che il metodo VDEC proposto è in grado di ottenere risultati stabili e buoni, con un valore di precisione di circa il 99,2% e il 99,1% in entrambi i set di dati con diversi valori di soglia.

About the author

Le Dr M. Lavanya dirige actuellement le département de maîtrise des applications informatiques, Sree Vidyanikethan Engineering College, A. Rangampet. Elle a terminé son doctorat à SPMVV, Tirupati. Elle a reçu son diplôme de M.CA de SV Univcersity, Tirupati dans l'année 2015. Ses domaines d'intérêt en matière de recherche comprennent l'analyse des données et la science des données.

Product details

Authors	M. Lavanya
Publisher	Edizioni Sapienza

Languages	Italian
Product format	Paperback / Softback
Released	01.01.2022

EAN	9786205023549
ISBN	9786205023549
No. of pages	188
Subject	Social sciences, law, business > Business > Individual industrial sectors, branches

Customer reviews

No reviews have been written for this item yet. Write the first review and be helpful to other users when they decide on a purchase.