Language Model Smoothing?

Byeinpaarfrage84 June 28, 2022February 26, 2025

Bei einem unigram languade model kann man mit dieser Formel berechnen wie wahrscheinlich es ist, dass ein query q in dem Dokument d vorkommt:

Falls ein token t in dem dokument nicht vorkommt, dann ist das gesamte Produkt 0, weshalb wir smoothing so definiert haben, dass P(t|C), statt P(t|D) verwendet wird, falls die term frequency von t in d gleich 0 ist, tf_t,d = 0 . C ist hier eine Collection, also die Menge aller Dokumente die man betrachtet.

Was kann man aber machen, wenn der term t überhaupt nicht in der Collection vorkommt? Dann steht man doch vor dem selben Problem?

(1 votes)

Information technology

Informatik Test Berechtigung?

ByCutie1284 November 1, 2022February 26, 2025

Könnt ihr mir bei dieser Aufgabe helfen verstehe die nicht und weiß nicht wie ich die berechtigen soll

Study choice

Welche Besoldungsgruppe nach abvsolviertem Dualen Studium beim BND?

ByMilchbraue201 July 20, 2024February 19, 2025

Hallo, ich frage mich momentan wie das Einstiegsgehalt beim BND im höheren nicht technischen Dienst ausschaut. Außerdem würde ich gerne erfahren, ob die Zeitabhängigen Stufen durch die 3 Jahre im Studium angerechnet werden. Beste Grüße, und ich danke für hilfreiche Antworten!

Programming & Software development

Welche KI’s zeichnen Bilder?

Bypeso05 March 24, 2023February 17, 2025

Ich würde gerne aus Spaß ausprobieren, einem KI zu sagen was er zeichnen soll. Welche kostenlosen gibt es da zum Testen?

Programming & Software development

Frage zu Chat gpt?

ByKlaus904 September 25, 2023February 16, 2025

Wenn ich Chat gpt was schreiben möchte dann kommt immer die Antwort: Anwendungsfehler: Es ist eine clientseitige Ausnahme aufgetreten (weitere Informationen finden Sie in der Browserkonsole) . Was bedeutet das und wie behebe ich den Fehler?

Programming & Software development

Rasa Bot Open Source trainiert nicht, woran liegt das?

Byolgagolban October 30, 2024February 15, 2025

Hallo zusammen, ich brauche den Rasa Open Source Chatbot um einige Testungen für die Uni (Bericht) zu machen. Ich habe das Setup soweit fertig und alle benötigten Befehle wie es bei Rasa auf der Webseite steht ausgeführt. Bei dem Befehl ´rasa init´ ist jedoch das Problem, dass er mir das gewöhnliche Modell (initial model) nicht…

Programming & Software development

Ist es möglich, einen AI-Chatbot ohne APIs mit HTML, CSS und JS zu programmieren?

Bymaxkiv January 6, 2024February 16, 2025

Hallo! Ich möchte versuchen, einen AI-Chatbot mit HTML, CSS und JavaScript zu programmieren, der ohne Internet funktioniert. Das heißt ohne APIs und anderen Dingen, die Internetverbindung brauchen. Ist das möglich? Wenn ja, dann wie?

1 Answer

Oldest

Newest Most Voted

Inline Feedbacks

View all comments

Nilsneun

2 years ago

Wenn ein token in der gesamten Collection nicht vorkommt, dann brauchst du es nicht zu betrachten.

Das language model wird in diesem Kontext ja verwendet um zwischen verschiedenen Dokumenten entscheiden zu können, welches am ehesten einen query generiert. Und wenn in der gesamten Collection ein token aus dem query nicht vorkommt, dann hat dieses token auch keinen Einfluß auf die Wahrscheinlichkeit.

Similar Posts