DBpedia est un effort communautaire pour extraire des informations structurées à partir de Wikipedia et de rendre cette information disponible sur le Web








télécharger 10.7 Kb.
titreDBpedia est un effort communautaire pour extraire des informations structurées à partir de Wikipedia et de rendre cette information disponible sur le Web
date de publication08.06.2018
taille10.7 Kb.
typeDocumentos
ar.21-bal.com > droit > Documentos
Vous êtes ici:

DBpedia est un effort communautaire pour extraire des informations structurées à partir de Wikipedia et de rendre cette information disponible sur le Web. DBpedia vous permet de poser des requêtes complexes contre Wikipedia, et de lier d'autres ensembles de données sur le Web à des données de Wikipedia. Nous espérons que ce sera plus facile pour la quantité incroyable d'informations sur Wikipedia pour être utilisé dans des façons nouvelles et intéressantes, et qu'il pourrait inspirer de nouveaux mécanismes pour la navigation, la liaison et l'amélioration de l'encyclopédie elle-même.

DBpedia en direct

DBpedia est considéré comme le miroir du Web sémantique de Wikipedia. Par moment, les articles de Wikipédia sont révisés, ce qui rend les données dans DBpedia obsolète.
L'objectif principal de DBpedia-Live est de garder DBpedia toujours en synchronisation avec Wikipedia.

1. vue d'ensemble

Le noyau de DBpedia se compose d'un procédé d'extraction infobox. InfoBoxes sont des modèles contenus dans de nombreux articles de Wikipédia. ils
sont généralement affichés dans le coin en haut à droite des articles et contiennent des informations factuelles.
En dehors de l'extraction infobox, le cadre a actuellement 19 extracteurs qui traitent les types de contenu suivants Wikipedia:

     Les étiquettes.
     Résumés.
     Liens interlangue.
     Images.
     Les redirections.
     Pour lever les ambigüités.
     Liens externes.
     Les liens de page.
     Pages d'accueil.
     Geo-coordonnées.
     Données des personnes.
     PND.
     SKOS catégories.
     Page d'identification.
     Identifiant de révision.
     Étiquette de catégorie.
     Catégories d'articles.
     Mappages.
     Infobox.

Architecture du système DBpedia-Li

ezfdsf

sdf

Dsf

Dsf

Les principales composantes de DBpedia-Live système sont les suivants:

     Local Wikipedia: Nous avons installé un local Wikipedia qui sera en synchronisation avec Wikipedia. L'Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) permet à une application pour obtenir un flux continu de mises à jour à partir d'un wiki. OAI-PMH est également utilisé pour nourrir les mises à jour dans le Gestionnaire d'extraction DBpedia-Live.
     Cartographie Wiki: mappages DBPedia peut être trouvé à http://mappings.dbpedia.org. Il est aussi un wiki. Nous pouvons également utiliser le protocole OAI-PMH pour obtenir le flux des mises à jour dans les mappages DBPedia. Fondamentalement, un changement de la cartographie a ecte plusieurs pages de Wikipédia, qui devraient être retraités.
     Gestionnaire d'extraction DBpedia-Live: Cette composante est le cadre extraction proprement dite DBpedia-Live. Quand il ya une page qui doit être traitée, le cadre s'applique aux extracteurs à ce sujet. Après traitement d'une page, les triplets nouvellement extraites sont insérés dans le magasin de backend triple (Virtuoso), en écrasant les triplets vieux. Les triplets nouvellement extraites sont également écrit que N-Triples fichier et compressé. D'autres applications ou DBpedia-Live miroirs qui devraient toujours être en synchronisation avec notre DBpedia-Live peuvent télécharger ces fichiers et de les nourrir dans sa propre triplestore. Le gestionnaire de l'extraction est discutée plus en détail ci-dessous.

3. Nouvelles fonctionnalités

L'ancien basé sur PHP-cadre est déployé sur un des serveurs de OpenLink et dispose actuellement d'un point de terminaison SPARQL au http://dbpedia-live.openlinksw.com/sparql.
En plus de la migration vers Java, la nouvelle DBpedia-Live cadre présente les nouvelles fonctionnalités suivantes:

     L'extraction Résumé: Le résumé d'un article de Wikipedia sont les premiers paragraphes de cet article. Le nouveau cadre a la capacité de proprement extraire le résumé d'un article.
     Cartographie touchés par pages: Lors d'un changement dans la cartographie, les pages affectées par cette cartographie doit être retraité et leurs triples devrait être mis à jour pour refléter ce changement.
     Mise à jour pages non modifiées: Parfois, un changement dans le système se produit, par exemple un changement dans la mise en oeuvre d'un extracteur. Cette modification peut affecter de nombreuses pages, même si elles ne sont pas modifiés. En DBpedia Live, nous utilisons une file d'attente de faible priorité de tels changements, tels que les mises à jour seront éventuellement apparaître dans DBpedia Live, mais de récentes mises à jour de Wikipedia sont traitées en premier.
     Publication de changesets: Sur modifications triple anciens sont remplacés par des triples mis à jour. Ces triplets ajoutée et / ou supprimés sont également écrit que N-Triples fichiers, puis compressé. Toute application cliente ou DBpedia-Live miroir pouvez télécharger ces fichiers et d'intégrer et, par conséquent, mettre à jour une copie locale de DBpedia. Cela permet que l'application de toujours en synchronisation avec notre DBpedia-Live.
     Développement d'un outil de synchronisation: L'outil de synchronisation permet un miroir DBpedia-Live pour rester en synchronisation avec notre critère d'évaluation en direct. Il télécharge les fichiers Changeset séquentielle, les décompresse et les intègre à un autre miroir DBpedia-Live.

4. Pointeurs importants

     SPARQL-critère: Le DBpedia-Live SPARQL-point de terminaison peut être consulté à l'http://live.dbpedia.org/sparql.
     DBpedia-Live Statistiques: Quelques statistiques simples sont fournis lors de l'extraction sur http://live.dbpedia.org/livestats.
     Mises à jour: Les fichiers N-Triples contenant les mises à jour peut être trouvé à http://live.dbpedia.org/liveupdates.
     DBpedia-Live Sourcecode: http://dbpedia.hg.sourceforge.net/hgweb/dbpedia/extraction_framework.
     Outil de synchronisation: http://sourceforge.net/projects/dbpintegrator/files/.

L'ensemble des données DBpedia

L'ensemble des données DBpedia utilise un grand multi-domaine ontologie qui a été tirée de Wikipedia. L'ensemble des données DBpedia décrit actuellement 3,64 millions de «choses» avec plus de un demi-milliard des «faits» (Juillet 2011).

similaire:

DBpedia est un effort communautaire pour extraire des informations structurées à partir de Wikipedia et de rendre cette information disponible sur le Web iconRésumé a partir des travaux portant sur l’image des points de vente,...
«information» des sites web, mais aussi la capacité des dimensions classiques du concept d’image des magasins à être appliquées aux...

DBpedia est un effort communautaire pour extraire des informations structurées à partir de Wikipedia et de rendre cette information disponible sur le Web iconQU'Est-ce que le droit communautaire ?
«la chaise vide». Sur une proposition de réforme de la pac, la France va bloquer le fonctionnement des institutions politiques pendant...

DBpedia est un effort communautaire pour extraire des informations structurées à partir de Wikipedia et de rendre cette information disponible sur le Web iconPour des informations plus détaillées sur les modifications des conditions...
«Documentation» signifie les manuels, spécifications et documentation similaire relatifs au logiciel, qui accompagnent le logiciel...

DBpedia est un effort communautaire pour extraire des informations structurées à partir de Wikipedia et de rendre cette information disponible sur le Web iconRésumé : Cette recherche porte sur la promotion touristique d’un...

DBpedia est un effort communautaire pour extraire des informations structurées à partir de Wikipedia et de rendre cette information disponible sur le Web iconJeune designer franco-argentin est l’auteur de cette création baptisée
Le concept de cette lampe de plafond est de former des courbes à partir de segments droits

DBpedia est un effort communautaire pour extraire des informations structurées à partir de Wikipedia et de rendre cette information disponible sur le Web iconFayssal khaldoun
«Web 0» utilisée par Dale Dougherty (en) en 2003, diffusée par Tim O'Reilly en 2004 et consolidée en 2005 avec l'exposé de position...

DBpedia est un effort communautaire pour extraire des informations structurées à partir de Wikipedia et de rendre cette information disponible sur le Web iconI. web sémantique [1] Définition
«The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers...

DBpedia est un effort communautaire pour extraire des informations structurées à partir de Wikipedia et de rendre cette information disponible sur le Web iconLa présence d'un système d'information informatisé est devenue une...

DBpedia est un effort communautaire pour extraire des informations structurées à partir de Wikipedia et de rendre cette information disponible sur le Web iconRechercher, extraire et organiser l’information utile

DBpedia est un effort communautaire pour extraire des informations structurées à partir de Wikipedia et de rendre cette information disponible sur le Web iconDossier d’informations communales sur les risques majeurs
«L'information donnée au public sur les risques majeurs comprend la description des risques et de leurs conséquences prévisibles...








Tous droits réservés. Copyright © 2016
contacts
ar.21-bal.com