Metadatenbasiertes Bildretrieval

 

Recherche im Rahmen der Diplomvorbereitung Informations- und Wissenmanagements im WS 02/03

Sebastian Mettenheimer

 

 

Inhalt

 

1       Bildretrieval 1

1.1          Allgemein  1

1.2          Vorhandene Systeme. 3

2       Strukturierung von Daten. 4

2.1     XML 4

2.1.1             Vorhandene Dialekte zur Beschreibung von Bildinhalten/-informationen  4

2.2          Ontologien  4

2.2.1             RDF & RDF-Schema  4

2.3          Thesaurus und Klassifikation  5

2.3.1             Grundlagen zur Erstellung von TH uns KL 5

2.3.2             Vorhandene TH und KL zur Bildindexierung  5

2.3.3             Softwares zur Erstellung von TH und KL 6

2.4     Dublin Core und andere Strukturierungsmöglichkeiten  7

3       Grafikformate und ihre technischen Metadaten  7

3.1     PNG. 7

3.1.1             Allgemein  7

3.1.2             Technische Metadaten  7

3.1.3             Links 7

3.2     JPG. 8

3.2.1             Allgemein  8

3.2.2             Technische Metadaten  8

3.3     GIF. 8

3.3.1             Allgemein  8

3.3.2             Technische Metadaten  8

4    PHP und MYSQL. 8

4.1     PHP in Zusammenarbeit mit XML 8

1        Bildretrieval

1.1         Allgemein

 

CBIR – Content Based Image Retrieval

 

Es gibt auch „region-based retrieval“ in Bildern, wobei hier die Einordnung von Farben, Formen,... zum Einsatz kommt. Z.B. die Suchmaschine http://ana.ctr.columbia.edu/metaseek/ (ein beschreibendes Paper (11-seitig http://citeseer.nj.nec.com/cache/papers/cs/9850/http:zSzzSzwww.ee.columbia.eduzSz~anazSzhomepagezSz.zSzpublicationszSzIEEE-ICjul98.pdf/benitez98using.pdf)

W3C Konferenz zum Thema “feature content metadata extraction and encoding” à http://www.www10.org.hk/cdrom/posters/p1142/index.htm

Inhalt: extraction of image features and representation as metadata tags in the header of the html record

 

 

Links:

 

Forschungsgruppe zum CBIR – Content Based Image Retrieval

mit Beispiel-Bilddatenbanken mit Recherchemöglichkeiten

http://www-db.stanford.edu/IMAGE/

 

Paper über Softwares zum CBIR

http://www.jisc.ac.uk/jtap/htm/jtap-054.html

 

Liste mit Papers zu CBIR und Liste von Softwares zum CBIR

http://viper.unige.ch/other_systems/

 

Skript zur Bildindexierung und Bildretrieval
http://www.capurro.de/iwmodul5.html
http://www.capurro.de/iwmodul5.html#5.3.5
http://www.capurro.de/iwmodul6.html#6.5

 

Seminararbeit - Einführung in Bilderkennung, -komprimierung, -suche
http://wwwdbis.informatik.uni-kl.de/courses/seminar/SS2002/ausarbeitung8.pdf

 

Seminararbeit - Data Mining -- Mining in Multimediadatenbanken (Kap. 3.3)
http://www.tu-dresden.de/wwwiisih/ftp/hsws0102/Seminararbeit_Juergens.pdf

 

Imageretrieval - Inhaltserschließung von Bildern
http://www-dbs.inf.ethz.ch/~mmir/SS2002/Folien/kap3_1.pdf

 

Paper über Metadaten für Bilder (Literaturhinweise beachten)

http://www.ukoln.ac.uk/metadata/presentations/cir99/paper.html

 

Internationale Organisation für Bildmanagement – Siehe auch genauere Links bei Strukturierung von Daten - Dublin Core in diesem Dokument)

http://www.vraweb.org/

 

Paper über EDV-Bildarchivierung aus Sicht der Library of Congress

http://memory.loc.gov/ammem/techdocs/libt1999/libt1999.html

 

Website der „Association for Information and Image Management“

Herausgeber der Zeitschrift “e-doc“´

http://www.aiim.org/

 

Homepage mit Anleitung zum Bildmerkmale finden und Einführung in Bildretrieval

http://aic.stanford.edu/conspec/emg/juergens/

 

Paper - Image Description on the Internet

http://www.dlib.org/dlib/january97/oclc/01weibel.html

 

Umfassende Beschreibung der Kategorien zur Einordnung von Kunst(-bildern)

http://www.getty.edu/research/institute/standards/cdwa/index.html

 

Skript mit globalem Ansatz zur Verfügbarmachung von Bildmaterial (Metadaten)

http://www.rlg.org/preserv/diginews/diginews4-3.html

 

Skript über die Ansätze beim Planen einer Bilddatenbank (Englisch-sprachig)

http://www.getty.edu/research/institute/standards/introimages/index.html

 

Skript über die Ansätze beim Planen einer Bilddatenbank – hier: historische Bilder (Englisch-sprachig)

http://www.clir.org/pubs/reports/ostrow/pub71.html

 

Technische Informationen, Text-Markup und Links zu Papers über Bilddatenbanken (Englisch-sprachig)

http://memory.loc.gov/ammem/ftpfiles.html

 

80seitiges Paper über deskriptive Modelle für Bildmaterial (Engisch-sprachig)

http://www.knaw.nl/ecpa/sepia/workinggroups/wp5/deliverable51.pdf

 

Überblick über Metadaten-Standards / Beschreibungssprachen (SGML, XML,...) als kommentierte Linkliste

http://coloradodigital.coalliance.org/access.html

 

Masterarbeit (66 MB) über bildinhaltliche Datenbankrecherche in Wappensammlung IBM Ultimedia Manager

http://heron.informatik.uni-augsburg.de/master/wolf-tilo_balke.ps

 

Lange Linkliste über EDV-Bildarchivierung aus Sicht von Museen (aus der schon einige der genannten Links stammen...) und am Ende eine Liste mit Bildarchiven von Harvard, British Columbia, NY Public Library, Berkley,...

http://lcweb.loc.gov/rr/print/vmbib.html

 

Studentische Gruppenarbeit (2001) über Bildretrieval mit Links zu Papers über inhaltsbasiertes Bildretrieval

http://www.iud.fh-darmstadt.de/iud/wwwmeth/LV/Ss01/im5/Grp3Bild/

Artikel aus der Recherche der genannten Gruppenarbeit – aus archive.org wieder hergestellt

http://web.archive.org/web/20010424235520/http://woodworm.cs.uml.edu/~rprice/ep/zhu-workshop/index.html

      Vorstellung eines Algorithmus zum CBIR

http://web.archive.org/web/20010424235520/http://woodworm.cs.uml.edu/~rprice/ep/zhu-workshop/index.html

!         !!!!!!!!!!!!!!!!!!!!!!!!!

http://visinfo.zib.de/IRS 

      http://www.zib.de/bib/jb/JB97/node111.html

 

HTML-Slide-Show zu content based image retrieval (CBIR) und Ähnlichkeitsformen

http://users.informatik.fh-hamburg.de/~ais/ss2000/abstr/s_schroeder/sld001.htm

 

Paper zu “content-based retrieval of segmented images”

http://lucan.ddns.comp.nus.edu.sg/Publications/hkp-pub/conf/acm_mm94_chua_hkp.pdf

 

 

 

1.2         Vorhandene Systeme

 

Links:

 

HERON-System für digitale Bibliotheken mit Bild-Thesaurus

http://www.cg.cs.tu-bs.de/v3d2/sep99workshop/slides/heron.pdf

 

Website der Uni Augsburg à Entwickler des HERON-Systems (! Blick auf Linkliste werfen !)

http://HERON.informatik.uni-augsburg.de

 

Query by image content – IBM-Datenbank

http://wwwqbic.almaden.ibm.com/

 

CAFIIR zur Gesichtserkennung

 

IRIS

 

NIGMA (query by example)

 

HySpirit

http://ls6-www.informatik.uni-dortmund.de/~altensch/magic/node58.html

 

- Einschub, weil auch interessant, hat aber nichts mit Metadaten sondern Mustererkennung zu tun -

Query by example – Textur, Hintergrund, Farbe,... als Grundlage zur Bildrecherche – Beispiel von Berkley (sehr faszinierend!)

http://dlp.cs.berkeley.edu/photos/blobworld/start.html

 

VIRAGE

http://www.virage.com/

BIRDS-I Algorithmus zur Suche von Bildern im Internet

http://arxiv.org/ftp/cs/papers/0012/0012021.pdf

 

 

 

2        Strukturierung von Daten

 

Links:

 

Beschreibung der analytischen Vorgehensweise zur Erstellung eines Konzepts für Metadaten am Beispiel von Bibliotheken

http://www.ala.org/alcts/organization/ccs/ccda/tf-meta3.html

 

 

 

2.1         XML

2.1.1          Vorhandene Dialekte zur Beschreibung von Bildinhalten/-informationen

Es ist zu prüfen, ob es etwas, wie Voice-XML auch für Bilder gibt...

 

SVG – Scalable Vector Graphics

MML – Multimedia Markup Language

DesignXML – Dialekt für CAD-Bilder

SMIL – Synchronized Multimedia Language

TML – TechML, XML-Dialekt zur Beschreibung von Lehrmaterial im WWW

Links:

 

DesignXML-Spezifikation

http://www.designxml.org/schema/DesignXML_V_100.xdr

 

SVG-Spezifikation

http://www.w3.org/TR/SVG/

 

SMIL-Spezifikation

http://www.w3.org/TR/smil20/

 

 

2.2         Ontologien

 

Amerikanische Projektgruppe, die einen Stanardthesaurus entwickelt und einen Ontologiebrowser zum download anbietet

http://ontology.teknowledge.com/ 

 

 

 

2.2.1          RDF & RDF-Schema

 

Links:

 

W3C-Spezifikation RDF

http://www.w3.org/TR/REC-rdf-syntax/

 

W3C-Spezifikation für RDF-Schema

http://www.w3.org/TR/rdf-schema/

 

Einführung in RDF (Paper, Englisch-sprachig)

http://www.dlib.org/dlib/may98/miller/05miller.html

 

Einführung in das Semantic Web (semantische Darstellung des WWW mittels RDF)

http://www.w3.org/2001/sw/

 

 

 

2.3         Thesaurus und Klassifikation

2.3.1          Grundlagen zur Erstellung von TH uns KL

 

Links:

 

Einführung in die Arbeit mit kontrolliertem Vokabular (Englisch-sprachig)

http://www.getty.edu/research/institute/vocabulary/introvocabs/

 

Tutorial zur Erstellung eines Thesaurus

http://instruct.uwo.ca/gplis/677/thesaur/main00.htm

 

Online-Tutorial zur Erstellung eines Thesaurus und einer Klassifikation

http://www.bui.fh-hamburg.de/pers/ulrike.spree/TutorialBetaversion/medok3tutbeta1/frame.html

 

 

 

2.3.2          Vorhandene TH und KL zur Bildindexierung

 

Links:

 

Alphabetische Liste von (fast) allen Thesauri im Web

http://www.darmstadt.gmd.de/~lutes/thesalpha.html

 

Weitere Liste von Thesauri, Klassifikationen, kontrolliertem Vokabular,…

http://www.getty.edu/research/institute/vocabulary/introvocabs/tools.html#cdwa

 

Arts & Architecture Thesaurus

http://www.getty.edu/research/tools/vocabulary/aat/

 

ICONCLASS - Klassifikation

http://www.iconclass.nl/

http://www.iconclass.nl/libertas/ic?style=index.xsl

 

Thesaurus for Graphic Materials 1 (Subject terms)

http://www.loc.gov/rr/print/tgm1/

 

Thesaurus for Graphic Materials 2 (genre and physical characteristic terms)

http://www.loc.gov/rr/print/tgm2/

 

Glossar für die Archivierung von Digitalen Photographien

http://www.shortcourses.com/choosing/glossary/19.htm

 

Glossar für audiovisuelle Medien

http://www.shortcourses.com/choosing/glossary/19.htm

 

Kodak-Glossar für digitale Bilder (auch lokal gespeichert...)

http://www.kodak.com/US/en/digital/dlc/book4/chapter2/index.shtml

 

Kodak-Glossar für Photographien

http://www.kodak.com/global/en/consumer/glossary/glossaryContents.shtml

 

Northern Micrographics Glossar für Bilder

http://www.normicro.com/glossary.htm

 

Glossar für Print und Bild

http://printindustry.com/glossary.htm

 

IRIS Thesaurus

http://carousel.lis.uiuc.edu/~iris/thesaurus.html

Website zu IRIS

http://web.archive.org/web/20011104061433/www.library.uiuc.edu/iris/

 

INFODATA Thesaurus

http://www.iud.fh-darmstadt.de/iud/wwwmeth/publ/example/werkz/infodata/regista2.htm

 

Visualisierter allgemeiner Thesaurus

http://thesaurus.plumbdesign.com/index.jsp

 

 

 

2.3.3          Softwares zur Erstellung von TH und KL

 

Links:

 

Kommentierte Liste von Softwares zum Handling von digitalen Daten (Englisch-sprachig)

http://coloradodigital.coalliance.org/software.html

 

Liste von Software zur Erstellung von Thesauri und Klassifikationen

http://bak-information.ub.tu-berlin.de/software/autothes.html

 

gut kommentierte Liste von Software zur Erstellung und Bearbeitung von Thesauri

http://www.willpower.demon.co.uk/thessoft.htm

 

Liste von Software zur Erstellung von Thesauri http://web.archive.org/web/20011101104655/www.fbi.fh-koeln.de/labor/Bir/thesauri_new/thessoft.htm

 

 

 

2.4         Dublin Core und andere Strukturierungsmöglichkeiten

 

Links:

 

Website der Dublin Core Metadata Initiative

http://dublincore.org/

 

Paper über Metadaten mit Dublin Core

http://www.dlib.org/dlib/june97/metadata/06weibel.html

 

Paper – “Discovering online resources across the humanities: a practical implementation of the Dublin Core”

http://www.ahds.ac.uk/old/public/metadata/disc_01.html

 

Liste mit kontrolliertem Vokabular und deren Beschreibungssprachen (DC,…)

http://www.vraweb.org/datastandard2.html

 

Lange Linkliste über Projekte mit Dublin Core (! Nach Ansätzen zu Metadaten für das Bildretrieval durchsuchen !)

http://www.ifla.org/II/metadata.htm

 

Paper - Metadaten von Bildern mit Dublin Core

http://www.vraweb.org/vracore3.htm

 

 

 

3        Grafikformate und ihre technischen Metadaten

Metadaten zur Beschreibung von technischen Charakteristika von Bildern, wie Farbe, Kanäle, Größe, Auflösung, Qualität, Komprimierung,...

Teilweise existiert die Möglichkeit der Eingabe von Freitext. Es ist u.a. zu prüfen, ob es schon Strukturierungsansätze für diesen Freitext gibt.

 

MPEG-7

http://www.lnt.de/~kaup/paper/fkt-2002.pdf

 

 

3.1         PNG

3.1.1          Allgemein

3.1.2          Technische Metadaten

3.1.3          Links

 

W3C_Spezifikation von PNG

http://www.w3.org/TR/REC-png.html

 

Offizielle PNG-Website

http://www.libpng.org/pub/png/

 

 

 

3.2         JPG

3.2.1          Allgemein

3.2.2          Technische Metadaten

 

 

 

3.3         GIF

3.3.1          Allgemein

3.3.2          Technische Metadaten

 

 

 

4        PHP und MYSQL

4.1         PHP in Zusammenarbeit mit XML

Sinnvoll wg. XML-Syntax in Ontologiesprache RDF-Schema