כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים 1. DBPEDIA
and how to publish
ontologies and linked data
on the web
מהןהפרסום דרכישל
אונטולוגיותומקושרים נתונים
ברשת
מבחן כמקרה DBpedia
4. קלאסי ווב סמנטי וובלהיות שואף
HTTP
URI
HTML XML
RDF
RDFS
OWL
טבעית שפה
ברמה מבניות
מסמך של
ברמה מבניות
מידע פריט של
מושגים
מוגדרים
פריט לכל
נתונים
מסמך לכל/לכל
מסמכים קבוצת
העשיר מידע
סמנטית
בין קישוריות
מסמכים
בין קישוריות
נתונים פריטי
אלה גם
הממוקמים
ווב בשרתי
שונים
אלה גם
הממוקמים
במערכי
שונים נתונים
6. •למושג אחידה הגדרה אין"בווב פרסום"
•כפירסום אותן לראות שניתן פעילויות מספר יש אך
המשפטי במובן כהפצה או,מהן אחת:
איחסון('אירוח,'Hosting)–שרתמארחקובץ,אם
הואמאחסןאותובדיסקאויוצראתהקובץ
מהנתוניםשהואמאחסן.
מתוך:Publishing and Linking on the Web
זה מה?
7. בשרת המאוחסנים לעמודים הגישה:
הקובץ את לקבל המארח לשרת בקשה שולח דפדפן
הקובץ של התוכן עם מגיב השרת,למשתמש מציג שהדפדפן
מתוך:Publishing and Linking on the Web
10. האונטולוגיה מרכיבי
OWL <----- RDFS <----- RDF/XML <----- RDF
מודלנתוניםשמתבססעלרעיונותש:
-לכלפריטנתוניםצריךלהיותמזההוובייחודי(URI)
-כלפריטנתוניםיכוללהיותמקושרלכלפריטנתוניםאחר,כאשרלקשרעצמוניתן
מזההוובייחודי(URI)
תחבירהנפוץביותרלכתיבתמרכיביהגרףה-RDFילקובץ
מספקתאתהאלמנטיםהבסיסייםלתיאוראונטולוגיה
שפהבעלתיכולתההבעהרבהיותר מתוך:Pollock, J. T. (2009).
Semantic web for dummies
בעצם אלה מרכיביה
את מאפשרים
הסמנטי פירסומה
13. Dereference the vocabulary URI, requesting HTML content
(Redirect the client to current HTML documentation for the vocabulary.)
Dereference the vocabulary URI (hash namespace)
(Serve the RDF description of the vocabulary, encoded as RDF/XML.)
מתוך:Best Practice Recipes for Publishing RDF Vocabularies (2008)
קודם לשקף חזור
תיאור הגשתRDF'אונטולוגיה של
לתיעוד דפדפן הפנייתHTML'האונטולוגיה של
המנגנון פעילות המחשתcontent negotiation
15. מקושרים נתונים זה מה?–מובנים נתונים לפרסום שיטה
אונטולוגיההמפורסמתכהלכה,היאבעצםמקרהפרטישלנתוניםמקושרים,
שעיקרונותיהםהם:
(1שימושב-URIכשמותשלמושגים/אובייקטים
(2שימושב-URIדרךפרוטוקולHTTP,המאפשרלאחזרתיאורמשאב,
המזוההעלידיURIזה(dereferention)
אומספרתיאוריםבעזרתcontent negotiation
(3שימושב-RDFו-RDF/XML(כאחתהאפשרויות)להסדרתמבניותהנתוניםוקישוריות
שלהםבתוךמערךנתוניםנתון
(4קישורי קביעת-RDFבווב אחרים נתונים למערכי
יחסים קישורי
זהות קישורי
מלים אוצר קישורי,מונחים מיפוי כולל
מתוך:Heath , T., Bizer , C. (2011).Linked Data: Evolving the Web into a Global Data Space
*למחשבים הקריא אחד
*אדם לבני הקריא אחד
17. סטאטיים נתונים
בפורמטים
שונים
לפורמט המרה
RDF
ב איחסון-
RDF STORE
נתונים ממשק
מקושרים
(Virtuoso)
סטאטיים נתונים
בפורמט
RDF
ב איחסון-
RDF STORE
נתונים ממשק
מקושרים
(Virtuoso)
קבצי
סטאטיים RDF
קלאסי ווב שרת
(Apache)
נתונים מסד
יחסיים
היוצר שרת
מעטפת
תצוגת ומפרסם
מקושרים נתונים
מסד מעל
יחסיים נתונים
)D2R(
נתונים הכנת
נתונים אחסון
נתונים פרסום
נתונים סוג
מובנים נתונים
מתוך:Heath , T., Bizer , C. (2011).Linked Data: Evolving the Web into a Global Data Space
מקושרים נתונים של פרסום אפשרויות מספר
21. של נתונים מערכי תוכן על נתונים קצתDBpedia
מזההיURIעבור24.9מיליוןיישויות(בכלהשפותיחד)
אנגלית+119שפותנוספות
4מליוןמתואריםבגרסההאנגליתשלמערךנתוניםDBpedia
•מתוכם3.2מיליוןמסווגיםעלידיאונטולוגייתDbpedia,
•כולל832,000אנשיםו-639,000מקומות
בסה"כ2.46מיליארדפרטימידע(שלשותRDF)
24.6מיליוןקישוריםלתמונות
27.6מיליוןקישוריםלדפיווברלוונטייםחיצוניים
45מיליוןקישוריםלמערכינתוניםחיצוניים
קטגוריזציות
67מיליוןקישוריםלקטגוריותויקיפדיה
41.2מיליוןקישוריםלקטגוריותYAGO(איחודנתוניויקיפדיהלקטגוריותwordnet)
529מחלקותהמתוארותעלידי2333מאפייניםבאונטולוגייתDbpedia
22. ויקיפדיה מצבורי
שונות בשיטות נתונים איחזור
שלשותRDF
אונטולוגיה נתונים מערכי,בהם
ויקיפדיה דף יש ליישות
באנגלית תואם
נתונים מערכי,בהם
ויקיפדיה דף אין ליישות
באנגלית תואם
ה
מ
ר
ה
Virtuoso (RDF STORE)
ואיחסון העלאה
http://dbpedia.org/data/Name
http://dbpedia.org/page/Name
SPARQL
endpoint
תיאורRDF
שלהמשאב
תיאורHTML
שלהמשאב
קבציRDF
הנתונים מערכי של
24. תיאורRDFהמשאב שלBerlin
(http://dbpedia.org/resource/ Berlin)
.1הקלדתURIשניתןלתיאורRDFישלמשאבזה,http://dbpedia.org/data/Berlin,
בדפדפןהקלאסימביאהלהורדתקובץxml:<?xml version="1.0" encoding="utf-8" ?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:owl="http://www.w3.org/2002/07/owl#"
xmlns:dbpprop="http://dbpedia.org/property/"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:ns5="http://dbpedia.org/ontology/PopulatedPlace/"
xmlns:dbpedia-owl="http://dbpedia.org/ontology/"
xmlns:foaf="http://xmlns.com/foaf/0.1/"
xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"
xmlns:ns9="http://www.w3.org/ns/prov#"
xmlns:grs="http://www.georss.org/georss/" >
<rdf:Description rdf:about="http://dbpedia.org/resource/1906_German_football_championship">
<dbpprop:location rdf:resource="http://dbpedia.org/resource/Berlin" />
</rdf:Description>
<rdf:Description rdf:about="http://dbpedia.org/resource/1959_German_football_championship">
<dbpedia-owl:city rdf:resource="http://dbpedia.org/resource/Berlin" />
<dbpprop:city rdf:resource="http://dbpedia.org/resource/Berlin" />
</rdf:Description>
.
.
.
<owl:sameAs rdf:resource="http://pl.dbpedia.org/resource/Berlin" />
<owl:sameAs rdf:resource="http://el.dbpedia.org/resource/Βερολίνο" />
<owl:sameAs rdf:resource="http://it.dbpedia.org/resource/Berlino" />
<owl:sameAs rdf:resource="http://yago-knowledge.org/resource/Berlin" />
<owl:sameAs rdf:resource="http://es.dbpedia.org/resource/Berlín" />
Editor's Notes תלוי בגודל מערך נתונים (קטן – קובץ אחד; גדול – מספר קבצים או העלאה ל-RDF STORE.
תלוי ברמת הדינמיות של הנתונים – משתנים לעתים רחוקות/לא משתנים – קבצים סטאטיים. משתנים לעתים קרובות – להשתמש במנגנון אחסון ונהול כמו זה של RDF STORE.
Virtuoso – שרת שיכול להכיל, בין היתר, נתונים מקושרים.
D2R – שרת שמאפשר פרסום של מסדי נתונים יחסיים ברשת הסמנטית. מאפשר שימוש ב-HTML ו-RDF. לוקח DB והופך אותו ל-RDF.