Yoan Blanc’s weblog

Another swiss guy lost in Paris

Pass me the bottle

Yoan BlancSun, 23 Sep 2007, , , ,

RDF Resource Description Framework Icon. Playing with the microformats for a while now and made some tests with eRDF or RDFa, all those solutions have pros and cons. But all of them are about putting metadata inside existing (X)HTML documents (RDFa accept only XHTML). Sometimes, you don’t want to alter all your website, or maybe you can’t.

GRDDL has the concept of extracting RDF from existing content without altering it with XSL Transformation. Basically, it’s very similar that how Technorati extracts Microformats with Brian Suda’s X2V but the purpose of them isn’t to produce RDF but iCalendar, vCard or Atom (which is similar to RSS). Microformats are very domain-specific, unlike eRDF or RDFa (but RDF is far for straightforward).

GRDDL is a transformation stylesheet your link from your page, that will made this page readable by a computer. I havn’t found that much documentation, so what follows may be wrong, feel free to correct me.

Because Microformats doesn’t have anything for wine, and wine is a good subject to study ontologies, I managed to build a stylesheet that extracts RDF from Cork’d. Yes, Cork'd already provide a tool to export in XML but this one is reserved to people with an account and it offers to export your cellar only. The XML output format isn’t more verbose that the HTML already is.

This should able anyone to feed their triple database with more wine. I don’t know exactly the goal of this. Maybe if you are a content publisher and wanted to aggregate some content for third parties this could be a solution. I’m sure that 99% of the developers would build a regex-based engine. XSLT is cool because, you must give him valid XML (use Tidy), it deals pretty nicely with charsets. Reusability of pure-functionnal programming is often easier (from my point of view) than with declarative ones.

P.S.: I stopped drinking alcohol at the beginning of this year, so my cellar is empty on Cork’d (and I cannot delete my account). Sob.

Je joue avec les microformats depuis un moment déjà, ai testé pour le fun RRDFa et eRDF qui ont pour but de normaliser certains types de contenu dans une page internet. Le but est prémacher le travail des moteurs qui indexent les pages ou de permettre des outils comme Operator qui rendent (du moins devrait) notre vie de tous les jours plus agréable (encore). Hélas ces solutions impliquent d’enrichir la sémantique des pages existantes ce qui n’est pas toujours simple ou faisable.

Et là, le W3C nous propose GRDDL qui a comme concept d’attacher aux pages une feuille de transformation XSL allant permettre la génération de RDF comme on peut l’aimer. Le principe est assez similaire au X2V de Brian Suda qu’utilise Technorati. Les microformats sont spécifiques à certains domaines, eRDF, RDFa ou GRDDL s’appliquent à tout ce qui ne facilite pas les choses. Pour la belle loi de Pareto, 80% si ce n’est pas 90% des besoins sont couverts par les microformats, pour le reste il faut mettre les mains de le cambouis.

J’ai écrit une petite feuille de style XSL permettant d’exporter une description oenologique depuis Cork’d en RDF selon l’ontologie Wine (qui n’est pas une mince affaire).

Le résultat n’est pas forcément ok, n’étant pas expert en la matière (merci de me faire vos commentaires). Sinon Cork’d offre la possibilité d’exporter en XML, mais cette fonctionnalité ne s’applique qu’à son cellier et le format n’offre rien de plus que l’HTML déjà présent.

Passer par GRDDL pour extraire du contenu de pages est intéressant du point de vue d’un outil voulant aggréger du contenu de partenaires tiers (avec ou sans leur accord). Si 99% des développeurs vont opter pour une solution à base d’expression régulière, l’approche XSL est plus qu’intéressante car la réutilisabilité de ce qui est fait me semble plus grande, et les outils gèrent très bien les différents codages de charactère (ce qui n’est pas le cas de tous les langages).

P.S.: ne vous étonnez pas de trouver mon cellier vide sur Cork’d je ne bois plus.

About

meYoan Blanc is a web developer that lives in Paris (19, rue Bichat75010France) works for Yahoo! and comes from Switzerland ( La Chaux-de-Fonds). This web site is for this weblog, a playground for random stuffs and can help keepingconnected with some friends out there.

Get my vCard or contact me by phone (+33 1 74 30 12 92) or email ().

Misc

RSS, list.blogug.ch

This site reflects only my opinion and is not affiliated with my employer.

copyright 2006-2007 — doSimple.ch