youtube-dl versucht von alleine das Video mit dem besten Bild (am größten, bester Codec etc. zu laden) und den Ton mit der höchsten Qualität zu laden. Das ist mit irgendeinem Flag die Einstellung bestvideo+bestaudio
. Youtube bietet das interessanterweise nur einzeln an, d.h. das beste Video ist eins ohne Tonspur und die beste Tonspur eine ohne Video. Darum merged youtube-dl die dann am Ende mit FFmpeg. Warum dieser Postprocessing-Schritt bei dir nicht stattfindet, weiß ich nicht. Hast du besondere Einstellungen für youtube-dl gemacht?
Dann lädst du AV1 herunter. AV1 ist ein sehr neuer Videocodec, den FFmpeg und damit auch mpv nur über die libaom unterstützt und eventuell in Ubuntu noch nicht paketiert ist? Youtube experimentiert seit einiger Zeit damit.
Als letztes lädst du Dash-Segmente herunter. MPEG-Dash ist ein Standard um dir Videostreams in Brocken auszuliefern (sodass man z.B. schnell zwischen HD und SD wechseln kann im Player). youtube-dl lädt dann alle diese Brocken herunter und verbindet sie zu einer Datei. Diese Datei mit fXXX im Namen war ein solcher Brocken.