Datenquellen für Text- und Datamining (TDM)
Mit dem Begriff Text- und Datamining (TDM) werden algorithmenbasierte Verfahren zur automatischen Extraktion von Informationen aus unstrukturierten oder nur schwach strukturierten Textdaten (Text Mining) und strukturierten Daten (Data Mining) zusammengefasst.
Auf dieser Seite finden Sie – nach inhaltlichen Kategorien geordnet – Ressourcen für das Text- und Datamining, die durch die Lizenzen der UB Bern und im frei zugänglichen Web verfügbar sind.
Falls nicht anderweitig angegeben, wenden Sie sich bei Interesse an einem Datenbezug bitte an die UB Bern.
Unterlagen von vergangenen Veranstaltungen zu TDM:
-
Text and Data Mining: A First View (2021, Folien auf Englisch)
-
Text- und Datamining in den Sozialwissenschaften (2022, Folien auf Deutsch)
Lizenzierte Daten-, Text- und Bildersammlungen
Ressource | Inhalt | Detailinformationen |
---|---|---|
Schweizer Medieninhalte: Swissdox@LiRI (allgemeine Information zur Datenbank Swissdox) |
|
|
WBIS Online (DeGruyter) (allgemeine Information zur Datenbank) |
|
|
Germanistik Online (DeGruyter) (allgemeine Information zur Datenbank) |
|
|
Romanische Bibliografie (DeGruyter) (allgemeine Information zur Datenbank) |
|
|
Bücher international: HathiTrust Research Center |
|
|
Cambridge Histories (CUP) |
|
|
Englischsprachige Periodika (Gale Cengage) | ||
Englischsprachige Periodika (ProQuest) |
|
|
Englischsprachige Monografien (Gale Cengage) |
|
|
UK Parliamentary Papers (ProQuest) |
|
Frei zugängliche Textsammlungen
Plattform | Inhalt | Detailinformationen |
---|---|---|
e-rara |
|
Übersicht zu Datenzugängen und Bedingungen |
e-manuscripta |
|
Übersicht zu Datenzugängen und Bedingungen |
e-periodica |
|
Übersicht zu Datenzugängen und Bedingungen |
Chronicling America |
|
Frei zugänglich, gemeinfrei |
CLARIN Resource Families |
|
Teilweise frei zugänglich, verschiedene Lizenzen |
Deutsches Textarchiv |
|
Frei zugänglich, CC-BY-SA |
GLAM Workbench |
|
Frei zugänglich, verschiedene Lizenzen |
Internet Archive |
|
Frei zugänglich, verschiedene Lizenzen, z.T. nicht angegeben |
OpenGLAM Survey |
|
Frei zugänglich, gemeinfrei oder offene Lizenzen |
Project Gutenberg |
|
Frei zugänglich, gemeinfrei |
Text Creation Partnership |
|
Frei zugänglich, gemeinfrei |
Rechtliches
Die Ressourcen und ihre Zugänge unterliegen verschiedenen rechtlichen und technischen Nutzungsbedingungen. Konsultieren Sie diese vor einem automatisierten Zugriff. Insbesondere für hier nicht aufgeführte lizenzierte Inhalte ist ein automatisierter Zugriff oft ausgeschlossen und kann zur Sperrung des Zugriffs auf die Datenbank durch den Anbieter führen. Kontaktieren Sie uns, wenn Sie unsicher sind, ob ein Zugriff rechtmässig ist.
Für wissenschaftliche Zwecke sind die mit TDM-Methoden verbundenen Vervielfältigungen und Speicherungen von rechtmässig zugänglichen Inhalten durch das Schweizerische Urheberrechtsgesetz erlaubt.
Die Verwendung der E-Medien oder Teile davon in Kombination mit Technologien der Künstliche Intelligenz (KI) ist in vielen Fällen vertraglich untersagt. Sollten sie einen solchen Einsatz von KI planen, müssen sie vorgängig Kontakt mit uns aufnehmen, um die entsprechenden Rahmenbedingungen zu klären.
Wenden Sie sich bei Fragen oder Unsicherheiten an uns.