Baustelle/Howto/llama.cpp

« Vorherige1Nächste »

Status: Ungelöst | Ubuntu-Version: Ubuntu 24.04 (Noble Numbat)
Antworten |

Dieses Thema ist die Diskussion des Artikels Baustelle/Howto/llama.cpp.

verdooft

Anmeldungsdatum:
15. September 2012

Beiträge: 4427

Zitieren

28. Mai 2025 20:05 (zuletzt bearbeitet: 28. Mai 2025 20:31)

Llama.cpp - lokal LLMs ausführen mit dem Schwerpunkt auf Text zu Text.

Das Bild kann gelöscht werden. Hab das mit der maximalen Breite von 600 Pixel erst nach dem Upload gesehen:

https://wiki.ubuntuusers.de/Baustelle/Howto/llama.cpp/llama-server-beispiel.png/

Achso, ich habe keine dezidierte Grafikkarte, drum kann ich nur die Nutzung per CPU testen. Das ist der Grund, warum der Artikel nicht als normaler Wikiartikel geeignet sein wird. Außerdem verstehe ich nicht alle Optionen. Die Einrichtung, inklusive OpenBlas und Kompilieren, wurde in einer frischen Ubuntu 24.04.2 VM getestet. Das HowTo ist aber noch lange nicht fertig.

Als Erinnerung an mich noch paar ToDos:

Übersicht über paar coole Modelle (Tabelle?)
Eventuell die kurzen Schreibweisen der Optionen doch noch der Tabelle hinzufügen
Weitere Beispiele zum selbst Quantisieren (llama-quantize), Multimodalmodellen (llama-mtmd-cli), llama-bench...
Mehr Wikiseiten zum Verständnis und Links am Ende einfügen
Darauf aufmerksam machen, dass mans auch als Deb-Paket bauen kann, verwende ich aufgrund der hohen Updatefrequenz (oft mehrmals am Tag) nicht

sh4711

Anmeldungsdatum:
13. Februar 2011

Beiträge: 1173

Zitieren

29. Mai 2025 20:36 (zuletzt bearbeitet: 29. Mai 2025 20:36)

verdooft schrieb: