gnn/beispiele/8.6_Multinomial_Naive_Bayes.py

from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB

# Trainingsdaten
spam_mails = [
    "Gewinnen Sie jetzt Geld!",
    "Klicken Sie hier für ein kostenloses iPhone!",
    "Exklusives Angebot nur für Sie!"
]

normale_mails = [
    "Können wir uns morgen für ein Meeting treffen?",
    "Hier sind die Dokumente, die Sie angefordert haben.",
    "Vergessen Sie nicht, die Rechnung zu bezahlen."
]

train_data = spam_mails + normale_mails
train_labels = ['spam'] * 3 + ['nicht-spam'] * 3

# Testdaten
test_data = [
    "Das Meeting wurde verschoben.",
    "Hier ist Ihr kostenloses Geschenk!",
    "Können wir das Meeting auf nächste Woche verschieben?"
]

# Text in Vektor umwandeln
vectorizer = CountVectorizer()
X_train = vectorizer.fit_transform(train_data)

# Modell trainieren
classifier = MultinomialNB()
classifier.fit(X_train, train_labels)

# Testdaten klassifizieren
X_test = vectorizer.transform(test_data)
predictions = classifier.predict(X_test)
print(predictions)