Fr. 102.00

Estrazione dei dati del web profondo basata sulla visione per il raggruppamento dei documenti web - Questo lavoro propone un approccio all'estrazione di dati web profondi basato sulla visione per il clustering dei documenti web (VDEC)

Italian · Paperback / Softback

Shipping usually within 2 to 3 weeks (title will be printed to order)

Description

Read more










L'approccio VDEC comprende due fasi: 1) estrazione dei dati web basata sulla visione e 2) raggruppamento dei documenti web. Nella fase 1, le informazioni della pagina Web vengono segmentate in vari chunk, dai quali vengono rimossi il rumore in eccesso e i chunk duplicati utilizzando tre parametri, quali la percentuale di collegamenti ipertestuali, il punteggio del rumore e la somiglianza del coseno. Per identificare i chunk rilevanti, vengono utilizzati tre parametri, quali la rilevanza del titolo, la selezione dei chunk basata sulla frequenza delle parole chiave e le caratteristiche della posizione, per poi estrarre un insieme di parole chiave da questi chunk principali. Infine, le parole chiave estratte vengono sottoposte a clustering dei documenti web utilizzando il Fuzzy C-Means clustering (FCM). L'estrazione di dati web profondi basata sulla visione proposta è stata implementata e testata utilizzando un set di dati sintetici. I risultati sono stati confrontati con i due algoritmi esistenti, il ViDE (Vision-based Data Record Extraction) e l'MDR (Mining Data Region). Dai risultati sperimentali eseguiti su due diversi set di dati sintetici, è emerso che il metodo VDEC proposto è in grado di ottenere risultati stabili e buoni, con un valore di precisione di circa il 99,2% e il 99,1% in entrambi i set di dati con diversi valori di soglia.

About the author










Le Dr M. Lavanya dirige actuellement le département de maîtrise des applications informatiques, Sree Vidyanikethan Engineering College, A. Rangampet. Elle a terminé son doctorat à SPMVV, Tirupati. Elle a reçu son diplôme de M.CA de SV Univcersity, Tirupati dans l'année 2015. Ses domaines d'intérêt en matière de recherche comprennent l'analyse des données et la science des données.

Product details

Authors M. Lavanya
Publisher Edizioni Sapienza
 
Languages Italian
Product format Paperback / Softback
Released 01.01.2022
 
EAN 9786205023549
ISBN 9786205023549
No. of pages 188
Subject Social sciences, law, business > Business > Individual industrial sectors, branches

Customer reviews

No reviews have been written for this item yet. Write the first review and be helpful to other users when they decide on a purchase.

Write a review

Thumbs up or thumbs down? Write your own review.

For messages to CeDe.ch please use the contact form.

The input fields marked * are obligatory

By submitting this form you agree to our data privacy statement.