SlideShare uma empresa Scribd logo
1 de 47
Baixar para ler offline
Semantic Search
Daan Odijk
ContentCafé
8 april 2015
ContentCafé proudly presents: Zoekt
en gij zult vinden… toch?
door CHARLOTTE VAN OOSTRUM geplaatst op 13 MAART 2015
Toen Google in 2013 5 minuten offline was. daalde het aantal page views
op het internet met 40%. We navigeren het web via zoekmachines: elke
maand stellen we met z’n allen elke 60 seconden zo’n 2.66 miljoen vragen
aan Google’s ondoorgrondelijke algoritmes. Het is dus niet zo gek om te
denken dat navigatie- of interactieproblemen ook met search ‘opgelost’
kunnen worden. Als je argumenten nodig hebt om aan te tonen dat dit niet
werkt. lees dan dit artikel.
Maar wanneer werkt search dan wel en hoe weet je of een zoekmachine
goed functioneert? Hoe kun je input leveren voor implementatie? Wat is
semantisch zoeken. wat zijn de praktische mogelijkheden en hoe kun je dat
zo inzetten dat jouw bezoekers niet eens meer hóeven te zoeken?
De elfde editie van het ContentCafé vindt plaats op woensdag 8 april om
19 uur Performance Solutions in Hoofddorp. We laten je graag verdwalen
en je weg terugvinden in de wereld van search. semantiek en algoritmes.
Term
je
en
het
dat
de
search
hoe
zoeken
contentcafé
denken
solutions
implementatie
web
presents
input
hoofddorp
gek
bezoekers
zoekmachine
google
TF
6
5
5
4
3
3
3
2
2
1
1
1
1
1
1
1
1
1
1
1
Term
je
en
het
dat
de
search
hoe
zoeken
contentcafé
denken
solutions
implementatie
web
presents
input
hoofddorp
gek
bezoekers
zoekmachine
google
TF
6
5
5
4
3
3
3
2
2
1
1
1
1
1
1
1
1
1
1
1
Term
je
en
het
dat
de
search
hoe
zoeken
contentcafé
denken
solutions
implementatie
web
presents
input
hoofddorp
gek
bezoekers
zoekmachine
google
TF
6
5
5
4
3
3
3
2
2
1
1
1
1
1
1
1
1
1
1
1
DF
88
109
105
78
109
47
74
9
111
7
5
2
9
8
3
5
2
17
2
5
Term
je
en
het
dat
de
search
hoe
zoeken
contentcafé
denken
solutions
implementatie
web
presents
input
hoofddorp
gek
bezoekers
zoekmachine
google
TF
6
5
5
4
3
3
3
2
2
1
1
1
1
1
1
1
1
1
1
1
DF
88
109
105
78
109
47
74
9
111
7
5
2
9
8
3
5
2
17
2
5
TF.IDF
0.07
0.05
0.05
0.05
0.03
0.06
0.04
0.22
0.02
0.14
0.20
0.50
0.11
0.12
0.33
0.20
0.50
0.06
0.50
0.20
Lucene
2.45
2.24
2.24
2.00
1.73
2.93
1.73
4.81
0.00
3.56
3.89
4.61
3.4
3.48
4.30
3.89
4.61
2.79
4.61
3.89
!TF
Luhn
1957
! TF.IDF
KSJ
1972
! BM25
Robertson
1995
!
Language Models
Kalt, 1996
PageRank
Brin & Page
1998
!
! ! !
!
!Learning to Rank
Fuhr (1992)
!
! ! !
!
ContentCafé proudly presents: Zoekt
en gij zult vinden… toch?
door CHARLOTTE VAN OOSTRUM geplaatst op 13 MAART 2015
Toen Google in 2013 5 minuten offline was. daalde het aantal page views
op het internet met 40%. We navigeren het web via zoekmachines: elke
maand stellen we met z’n allen elke 60 seconden zo’n 2.66 miljoen vragen
aan Google’s ondoorgrondelijke algoritmes. Het is dus niet zo gek om te
denken dat navigatie- of interactieproblemen ook met search ‘opgelost’
kunnen worden. Als je argumenten nodig hebt om aan te tonen dat dit niet
werkt. lees dan dit artikel.
Maar wanneer werkt search dan wel en hoe weet je of een zoekmachine
goed functioneert? Hoe kun je input leveren voor implementatie? Wat is
semantisch zoeken. wat zijn de praktische mogelijkheden en hoe kun je dat
zo inzetten dat jouw bezoekers niet eens meer hóeven te zoeken?
De elfde editie van het ContentCafé vindt plaats op woensdag 8 april om
19 uur Performance Solutions in Hoofddorp. We laten je graag verdwalen
en je weg terugvinden in de wereld van search. semantiek en algoritmes.
48pt
18pt
24pt
! Zoek
%
"#$
#
&
%
&
! Zoek
BM25
PageRank
Semantic Search
Semantic search
• Improve search accuracy by understanding
searcher intent and the contextual meaning
of terms and documents.
• Move beyond “ten blue links” (towards
actually answering information needs) using
rich context.
Semantic search
• What is “semantic” search?
• understanding intent, contextual meaning
• finding actual answers for information needs
• combining text and structure
• “Entity-centric search”
• Entity: uniquely identifiable thing or object
• “A thing with a distinct and independent
existence”
Challenges
"#$
#
! Zoek
Query
Understanding
Presentation &
Interaction
Document
Understanding
Presentation &
Interaction
Challenges
"#$
#
! Zoek
Document
Understanding
Interplay: (un)structured data
Unstructured Structured
xxxx x xxx xx xxxxxx xx x xxx xx x xxxx
xx xxx x xxxxxx xx x xxx xx xxxx xx xxx
xx x xxxxx xxx xx x xxxx x xxx xx xxxxxx
xx x xxx xx x xxxx xx xxx x xxxxxx xx x
xxx xx xxxx xx xxx xx x xxxxx xxx xx x
xxxx x xxx xx xxxxxx xx x xxx xx x xxxx
xx xxx x xxxxxx xx x xxx xx xxxx xx xxx
xx x xxxxx xxx xx x xxxx x xxx xx
xxxx x xxx xx xxxxxx xx x xxx xx x xxxx
xx xxx x xxxxxx xxxxxx xx x xxx xx x xxxx
xx xxx x xxxxx xx x xxx xx xxxx xx xxx xx
x xxxxx xxx
xxxx x xxx xx xxxxxx
adding structure to text
adding text to structure
Entity Profiling
- Entity profiling

- generate a profile of an entity
- summary (keywords/full-text)
- timelines
- …
- Slot filling

- automatically fill attribute fields
But first…
ice cube music
michelangelo
But first…
vin diesel
schema.org (RDFa)
• used by Google, Bing, Yandex, Yahoo!, IPTC,
etc.
Challenges
"#$
#
! Zoek
Query
Understanding
Distribution of web search
queries [Pound et al. 2010]
6%
36%
1%5% 12%
41%
Entity (“1978 cj5 jeep”)
Type (“doctors in barcelona”)
Attribute (“zip code waterville Maine”)
Relation (“tom cruise katie holmes”)
Other (“nightlife in Barcelona”)
Uninterpretable
Query Understanding
• First step: recognize, label, and
disambiguate entities in queries
• add: attributes/aspects
• add: types
• add: relationships
• add: actions/verbs
• etc.
• Then: query understanding
• what is the intent?
Query Understanding
• Adding structure to queries
• Query intents
• Query context 

(sessions, users, history, etc.)
• Interaction
Template-based query
understanding
• Rule-based approaches (editorial)

• high precision
• difficult to generalize
• costly to create/maintain
• Research into more generic approaches is ongoing
Challenges
"#$
#
! Zoek
Presentation &
Interaction
Presentation &
Interaction
Result presentation
• Rich result pages (SERPs)
• Directly displaying answers and relevant
information or context
Rich result pages
Direct displays
Keyword Queries
- Single-search-box paradigm
- Typical web search queries
- “Telegraphic”, i.e., neither
well-formed nor
grammatically correct
Keyword++ queries
- Augmented with
context
- form/facet-based
input
- location/date/TOD/…
Example keyword++ queries
Example keyword++ queries
Interaction: recommendation,
auto-completion
Interaction: recommendation,
auto-completion
Want to learn more?
d.odijk@uva.nl / daan.odijk.me
Edgar Meij – @edgarmeij

Yahoo Labs

Krisztian Balog – @krisztianbalog

University of Stavanger

Daan Odijk – @dodijk

University of Amsterdam
Entity Linking and Retrieval
Edgar Meij – @edgarmeij
Yahoo! Research
Krisztian Balog – @krisztianbalog
University of Stavanger
Daan Odijk – @dodijk
University of Amsterdam
Monday, May 13, 13
Tutorial on Entity Linking and Retrieval 

for Semantic Search
bit.ly/ELR-slides

Mais conteúdo relacionado

Semelhante a Daan Odijk | Semantic Search ContentCafé #11

Metadata & Google: a love story
Metadata & Google: a love storyMetadata & Google: a love story
Metadata & Google: a love storyArne van Elk
 
Training Webschrijven en SEO - deel 1
Training Webschrijven en SEO - deel 1Training Webschrijven en SEO - deel 1
Training Webschrijven en SEO - deel 1Matthijs van Engelen
 
Semantische zoekmachines voor wetenschap: een stresstest
Semantische zoekmachines voor wetenschap: een stresstestSemantische zoekmachines voor wetenschap: een stresstest
Semantische zoekmachines voor wetenschap: een stresstestvoginip
 
Semantisch Zoeken - knowledge graph, semantisch web, linked data, rdf, ontolo...
Semantisch Zoeken - knowledge graph, semantisch web, linked data, rdf, ontolo...Semantisch Zoeken - knowledge graph, semantisch web, linked data, rdf, ontolo...
Semantisch Zoeken - knowledge graph, semantisch web, linked data, rdf, ontolo...Eric Sieverts
 
Zoekmachinemarketing
Zoekmachinemarketing Zoekmachinemarketing
Zoekmachinemarketing voginip
 
Zoekmachinemarketing, hoe maximaliseer ik mijn online zichtbaarheid?
Zoekmachinemarketing, hoe maximaliseer ik mijn online zichtbaarheid?Zoekmachinemarketing, hoe maximaliseer ik mijn online zichtbaarheid?
Zoekmachinemarketing, hoe maximaliseer ik mijn online zichtbaarheid?Sander Lems
 
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.Eric Sieverts
 
Zoekmachinemarketing: hoe maximaliseer ik mijn online zichtbaarheid?
Zoekmachinemarketing: hoe maximaliseer ik mijn online zichtbaarheid?Zoekmachinemarketing: hoe maximaliseer ik mijn online zichtbaarheid?
Zoekmachinemarketing: hoe maximaliseer ik mijn online zichtbaarheid?valantic NL
 
Eduvision- Cursus Zoekmachine Marketing: de geheimen ontrafeld
Eduvision- Cursus Zoekmachine Marketing: de geheimen ontrafeldEduvision- Cursus Zoekmachine Marketing: de geheimen ontrafeld
Eduvision- Cursus Zoekmachine Marketing: de geheimen ontrafeldEduvision Opleidingen
 
Meten is weten vogin ip workshop 2016 joyce van aalten invenier
Meten is weten vogin ip workshop 2016 joyce van aalten invenierMeten is weten vogin ip workshop 2016 joyce van aalten invenier
Meten is weten vogin ip workshop 2016 joyce van aalten invenierJoyce van Aalten
 
Zoekmachinemarketing Bijeenkomst 1
Zoekmachinemarketing Bijeenkomst 1Zoekmachinemarketing Bijeenkomst 1
Zoekmachinemarketing Bijeenkomst 1Igor ter Halle
 
Usability Martin van Kranenburg
Usability Martin van KranenburgUsability Martin van Kranenburg
Usability Martin van KranenburgChickelien
 
Hoe optimaliseer je pagina's voor Search Intent - SEO Benelux Meetup 2022 @ i...
Hoe optimaliseer je pagina's voor Search Intent - SEO Benelux Meetup 2022 @ i...Hoe optimaliseer je pagina's voor Search Intent - SEO Benelux Meetup 2022 @ i...
Hoe optimaliseer je pagina's voor Search Intent - SEO Benelux Meetup 2022 @ i...Clarissa Filius | Booming
 
Hoe Krijg Ik Bezoekers
Hoe Krijg Ik BezoekersHoe Krijg Ik Bezoekers
Hoe Krijg Ik BezoekersIgor ter Halle
 
Iad2 1011q3 V04 Les1
Iad2 1011q3 V04 Les1Iad2 1011q3 V04 Les1
Iad2 1011q3 V04 Les1rolfHRO
 
Sessie 10 MFU- Remi van Beekum-Storm MC-
Sessie 10 MFU- Remi van Beekum-Storm MC-Sessie 10 MFU- Remi van Beekum-Storm MC-
Sessie 10 MFU- Remi van Beekum-Storm MC-StormAcademy
 

Semelhante a Daan Odijk | Semantic Search ContentCafé #11 (20)

Roeland Kok over SEO
Roeland Kok over SEORoeland Kok over SEO
Roeland Kok over SEO
 
Metadata & Google: a love story
Metadata & Google: a love storyMetadata & Google: a love story
Metadata & Google: a love story
 
Training Webschrijven en SEO - deel 1
Training Webschrijven en SEO - deel 1Training Webschrijven en SEO - deel 1
Training Webschrijven en SEO - deel 1
 
Semantische zoekmachines voor wetenschap: een stresstest
Semantische zoekmachines voor wetenschap: een stresstestSemantische zoekmachines voor wetenschap: een stresstest
Semantische zoekmachines voor wetenschap: een stresstest
 
Semantisch Zoeken - knowledge graph, semantisch web, linked data, rdf, ontolo...
Semantisch Zoeken - knowledge graph, semantisch web, linked data, rdf, ontolo...Semantisch Zoeken - knowledge graph, semantisch web, linked data, rdf, ontolo...
Semantisch Zoeken - knowledge graph, semantisch web, linked data, rdf, ontolo...
 
Zoekmachinemarketing
Zoekmachinemarketing Zoekmachinemarketing
Zoekmachinemarketing
 
Zoekmachinemarketing, hoe maximaliseer ik mijn online zichtbaarheid?
Zoekmachinemarketing, hoe maximaliseer ik mijn online zichtbaarheid?Zoekmachinemarketing, hoe maximaliseer ik mijn online zichtbaarheid?
Zoekmachinemarketing, hoe maximaliseer ik mijn online zichtbaarheid?
 
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
Semantisch zoeken - over knowledge graph, semantisch web, rdf enz.
 
Zoekmachinemarketing: hoe maximaliseer ik mijn online zichtbaarheid?
Zoekmachinemarketing: hoe maximaliseer ik mijn online zichtbaarheid?Zoekmachinemarketing: hoe maximaliseer ik mijn online zichtbaarheid?
Zoekmachinemarketing: hoe maximaliseer ik mijn online zichtbaarheid?
 
Eduvision- Cursus Zoekmachine Marketing: de geheimen ontrafeld
Eduvision- Cursus Zoekmachine Marketing: de geheimen ontrafeldEduvision- Cursus Zoekmachine Marketing: de geheimen ontrafeld
Eduvision- Cursus Zoekmachine Marketing: de geheimen ontrafeld
 
Meten is weten vogin ip workshop 2016 joyce van aalten invenier
Meten is weten vogin ip workshop 2016 joyce van aalten invenierMeten is weten vogin ip workshop 2016 joyce van aalten invenier
Meten is weten vogin ip workshop 2016 joyce van aalten invenier
 
Zoekmachinemarketing Bijeenkomst 1
Zoekmachinemarketing Bijeenkomst 1Zoekmachinemarketing Bijeenkomst 1
Zoekmachinemarketing Bijeenkomst 1
 
Vinden Of Zoeken
Vinden Of ZoekenVinden Of Zoeken
Vinden Of Zoeken
 
Seo Vision
Seo VisionSeo Vision
Seo Vision
 
Usability Martin van Kranenburg
Usability Martin van KranenburgUsability Martin van Kranenburg
Usability Martin van Kranenburg
 
Hoe optimaliseer je pagina's voor Search Intent - SEO Benelux Meetup 2022 @ i...
Hoe optimaliseer je pagina's voor Search Intent - SEO Benelux Meetup 2022 @ i...Hoe optimaliseer je pagina's voor Search Intent - SEO Benelux Meetup 2022 @ i...
Hoe optimaliseer je pagina's voor Search Intent - SEO Benelux Meetup 2022 @ i...
 
Hoe Krijg Ik Bezoekers
Hoe Krijg Ik BezoekersHoe Krijg Ik Bezoekers
Hoe Krijg Ik Bezoekers
 
Iad2 1011q3 V04 Les1
Iad2 1011q3 V04 Les1Iad2 1011q3 V04 Les1
Iad2 1011q3 V04 Les1
 
Hanjuni2015
Hanjuni2015Hanjuni2015
Hanjuni2015
 
Sessie 10 MFU- Remi van Beekum-Storm MC-
Sessie 10 MFU- Remi van Beekum-Storm MC-Sessie 10 MFU- Remi van Beekum-Storm MC-
Sessie 10 MFU- Remi van Beekum-Storm MC-
 

Mais de ContentCafé

Marielle Roozemond Agile Content Content Café
Marielle Roozemond Agile Content Content CaféMarielle Roozemond Agile Content Content Café
Marielle Roozemond Agile Content Content CaféContentCafé
 
Tim Manders | Embedding a thesaurus ContentCafé #10
Tim Manders | Embedding a thesaurus ContentCafé #10Tim Manders | Embedding a thesaurus ContentCafé #10
Tim Manders | Embedding a thesaurus ContentCafé #10ContentCafé
 
Joyce van Aalten | Enter de taxonomie ContentCafé #10
 Joyce van Aalten | Enter de taxonomie ContentCafé #10 Joyce van Aalten | Enter de taxonomie ContentCafé #10
Joyce van Aalten | Enter de taxonomie ContentCafé #10ContentCafé
 
Tim van Waard | Tone of voice ContentCafé #9
Tim van Waard | Tone of voice ContentCafé #9Tim van Waard | Tone of voice ContentCafé #9
Tim van Waard | Tone of voice ContentCafé #9ContentCafé
 
Thamar Kiemel | Future Friendly Content ContentCafé #06
Thamar Kiemel | Future Friendly Content ContentCafé #06 Thamar Kiemel | Future Friendly Content ContentCafé #06
Thamar Kiemel | Future Friendly Content ContentCafé #06 ContentCafé
 
Christiaan Lustig | Responsive web design en contentcreatie ContentCafé #06
Christiaan Lustig | Responsive web design en contentcreatie ContentCafé #06Christiaan Lustig | Responsive web design en contentcreatie ContentCafé #06
Christiaan Lustig | Responsive web design en contentcreatie ContentCafé #06ContentCafé
 
Franklin Heijnen | Leren van en over contentstrategie ContentCafé #02
Franklin Heijnen | Leren van en over contentstrategie ContentCafé #02Franklin Heijnen | Leren van en over contentstrategie ContentCafé #02
Franklin Heijnen | Leren van en over contentstrategie ContentCafé #02ContentCafé
 
Hans Kemp | Leren van en over contentstrategie ContentCafé #02
Hans Kemp | Leren van en over contentstrategie ContentCafé #02Hans Kemp | Leren van en over contentstrategie ContentCafé #02
Hans Kemp | Leren van en over contentstrategie ContentCafé #02ContentCafé
 
Niels Vrijhoeven | Publish or Perish ContentCafé #05
Niels Vrijhoeven | Publish or Perish ContentCafé #05Niels Vrijhoeven | Publish or Perish ContentCafé #05
Niels Vrijhoeven | Publish or Perish ContentCafé #05ContentCafé
 
Hidde Kross | Publish or Perish ContentCafé #05
Hidde Kross | Publish or Perish ContentCafé #05Hidde Kross | Publish or Perish ContentCafé #05
Hidde Kross | Publish or Perish ContentCafé #05ContentCafé
 

Mais de ContentCafé (10)

Marielle Roozemond Agile Content Content Café
Marielle Roozemond Agile Content Content CaféMarielle Roozemond Agile Content Content Café
Marielle Roozemond Agile Content Content Café
 
Tim Manders | Embedding a thesaurus ContentCafé #10
Tim Manders | Embedding a thesaurus ContentCafé #10Tim Manders | Embedding a thesaurus ContentCafé #10
Tim Manders | Embedding a thesaurus ContentCafé #10
 
Joyce van Aalten | Enter de taxonomie ContentCafé #10
 Joyce van Aalten | Enter de taxonomie ContentCafé #10 Joyce van Aalten | Enter de taxonomie ContentCafé #10
Joyce van Aalten | Enter de taxonomie ContentCafé #10
 
Tim van Waard | Tone of voice ContentCafé #9
Tim van Waard | Tone of voice ContentCafé #9Tim van Waard | Tone of voice ContentCafé #9
Tim van Waard | Tone of voice ContentCafé #9
 
Thamar Kiemel | Future Friendly Content ContentCafé #06
Thamar Kiemel | Future Friendly Content ContentCafé #06 Thamar Kiemel | Future Friendly Content ContentCafé #06
Thamar Kiemel | Future Friendly Content ContentCafé #06
 
Christiaan Lustig | Responsive web design en contentcreatie ContentCafé #06
Christiaan Lustig | Responsive web design en contentcreatie ContentCafé #06Christiaan Lustig | Responsive web design en contentcreatie ContentCafé #06
Christiaan Lustig | Responsive web design en contentcreatie ContentCafé #06
 
Franklin Heijnen | Leren van en over contentstrategie ContentCafé #02
Franklin Heijnen | Leren van en over contentstrategie ContentCafé #02Franklin Heijnen | Leren van en over contentstrategie ContentCafé #02
Franklin Heijnen | Leren van en over contentstrategie ContentCafé #02
 
Hans Kemp | Leren van en over contentstrategie ContentCafé #02
Hans Kemp | Leren van en over contentstrategie ContentCafé #02Hans Kemp | Leren van en over contentstrategie ContentCafé #02
Hans Kemp | Leren van en over contentstrategie ContentCafé #02
 
Niels Vrijhoeven | Publish or Perish ContentCafé #05
Niels Vrijhoeven | Publish or Perish ContentCafé #05Niels Vrijhoeven | Publish or Perish ContentCafé #05
Niels Vrijhoeven | Publish or Perish ContentCafé #05
 
Hidde Kross | Publish or Perish ContentCafé #05
Hidde Kross | Publish or Perish ContentCafé #05Hidde Kross | Publish or Perish ContentCafé #05
Hidde Kross | Publish or Perish ContentCafé #05
 

Daan Odijk | Semantic Search ContentCafé #11