Citation Hunt

Das unten stehende Wikipedia-Snippet wird von keiner verlässlichen Quelle unterstützt. Kannst du eine finden?

Klicke auf Verstanden!, um zu Wikipedia zu gehen und das Snippet zu reparieren, oder Nächstes!, um ein anderes zu sehen. Viel Glück!

In Seite Textklassifikation:

"

Die Textklassifikation ist ein sehr wichtiges Kriterium im Bereich der Informationsextraktion.

Bei unterschiedlich strukturierten Texten werden verschiedene Verfahren angewendet, die sich voneinander durch Merkmale wie Komplexität, Restriktionen oder den Ablauf der Extraktion unterscheiden. So gibt es z. B.: ein sprachbasiertes Verfahren (Perl) oder ein Wrapper-Induction-basiertes Verfahren. Daher ist es notwendig, die analysierten Texte zu klassifizieren.

Die Texte werden nach ihrer Strukturiertheit aufgeteilt:

  • Natürliche und unstrukturierte Plain-Texte,
  • Strukturierte Informationen,
  • Semi-strukturierte Texte.