gnn/beispiele/8.6_Multinomial_Naive_Bayes.py

38 lines
1.0 KiB
Python

from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
# Trainingsdaten
spam_mails = [
"Gewinnen Sie jetzt Geld!",
"Klicken Sie hier für ein kostenloses iPhone!",
"Exklusives Angebot nur für Sie!"
]
normale_mails = [
"Können wir uns morgen für ein Meeting treffen?",
"Hier sind die Dokumente, die Sie angefordert haben.",
"Vergessen Sie nicht, die Rechnung zu bezahlen."
]
train_data = spam_mails + normale_mails
train_labels = ['spam'] * 3 + ['nicht-spam'] * 3
# Testdaten
test_data = [
"Das Meeting wurde verschoben.",
"Hier ist Ihr kostenloses Geschenk!",
"Können wir das Meeting auf nächste Woche verschieben?"
]
# Text in Vektor umwandeln
vectorizer = CountVectorizer()
X_train = vectorizer.fit_transform(train_data)
# Modell trainieren
classifier = MultinomialNB()
classifier.fit(X_train, train_labels)
# Testdaten klassifizieren
X_test = vectorizer.transform(test_data)
predictions = classifier.predict(X_test)
print(predictions)