Documentation Unit Miner

La documentation pour Unit Minerest disponible au Format PDF et prête à télécharger (env. 200KB)

Tutoriels

Découvrez les tutoriels qui vous apprendont à rédiger votre propre script

Tutoriel 1 - rédiger une nouvelle à partir de sites Internet

Tutoriel 2 - répartir l'accès.log

Tutoriel 3 - récupérer des articles PR depuis www.prweb.com et les enregistrer sous la forme de fichiers

Pour plus d'exemples de scripts d'extraction, consultez nos exemples/démos en ligne.

Exemples d'utilisation

  • Regrouper des données financières
  • Regrouper des données immobilières
  • Obtenir des informations à propos des activités
  • Regrouper des données financières
  • Dater les informations des sites
  • Proposer de nouveaux services personnalisés
  • Proposer de nouveaux services novateurs

 

UnitMiner

est un système robuste, flexible et facile à gerer qui vous permet de contrôler, récupérer et classer les contenus de sites Internet, documents, ou autres sources de données non structurées.

Schéma d'extraction de données Internet

J'ai utilisé Unit Miner pour automatiser l'extraction des données Internet relatives aux paris. Jusqu'à présent, je suis très satisfait de ce programme. J'aimerais vous remercier de m'avoir aidé dans mon projet. je recommande votre logicielà toute personne à la recherche d'une solution d'extraction de données efficace.

Service Unit Miner

Nous avons crée une application d'extraction de données adaptée à vos demandes. Recevez les données de votre choix sans avoir besoin de logiciel, matéreil ni installation supplémentaire. En savoir plus

[Translate to French:] Introduction to web data extraction: How it works?

Avec l'explosion du World Wide Web, une richesse de données sur beaucoup de sujets différents est devenue disponible en ligne. D'habitude, les utilisateurs récupèrent des données du Web en xaminant et la recherche de mot-clé, ces méthodes traditionnelles ont leurs limitations et inconvénients. Examiner n'est pas approprié pour localiser les articles particuliers de données, parce qu'après de nombreuses liaisons aboutit souvent se perdu, pour ne mentionner que quelques méthodes. La recherche de mot-clé peut être plus efficace, mais rend souvent les quantités énormes de données. Les données sur l'Internet ne sont pas structurées comme par exemple dans des bases de données. Simplement dit - toutes les données sont là sur le réseau, mais réunir) et les formater de la façon désirable et est assez souvent au-delà des capacités humaines.

C'est quand l'extraction de données vient pour placer avec la capacité de récupérer des données du Web, les transformer et les transférer de la façon desided aux sites Web, xml des fichiers, des bases de données, des tableaux etc.

Les sites Web sont différents. Les données sont présentées différemment et la structure de changements de données lourdement d'un site Web à un autre. De plus, les sites Web utilisent le codage différent et des éléments de HTML différents pour montrer leur contenu. C'est le premier défi pour des outils d'extraction Web : la capacité d'extraire des données de ressources diverses.

L'approche traditionnelle pour extraire des données du Web est d''écrire spécialisent des programmes appelés des emballages. Ces programmes sont spécifiques pour chaque extraction. Ils dressent en fait la carte de données de sites Web, les transforment et leur fournissent pour la production (qui peut être un autre site Web, XML le fichier, la base de données, des tableaux, saisir pour la 3ème application de parti, vituellement n'importe quelle source structurée de données) des défis Principaux pour des emballages consistent en ce qu'ils doivent distinguer entre intéressant (par exemple des données nous voulons extraire) et des données non intéressantes (comme des petits bouts de code, des liaisons, des annonces etc), la poignée la structure mutli-hiérarchique, non-rigide comment sont des données présentées sur le Web.

Il y a beaucoup de défauts d'emballages se développant 

Gardez contact avec UnitMiner
© 2004-2012 QualityUnit.com, All rights reserved