Tencent schlägt Google bei Übersetzungen – mit Open-Source

Einklappen
X
 
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge
  • master
    Administrator
    • 02.09.2024
    • 4695

    #1

    Tencent schlägt Google bei Übersetzungen – mit Open-Source


    Tencent schlägt Google bei Übersetzungen – mit Open-Source Zwei neue Modelle dominieren internationale Benchmarks und sind frei nutzbar. Warum setzen sie neue Standards bei Qualität und Effizienz? Kurzfassung | Andreas Becker, 02.09.25
    gpt-image-1 | All-AI.de EINLEITUNG Das chinesische Tech-Unternehmen Tencent hat zwei neue KI-Modelle zur maschinellen Übersetzung veröffentlicht – frei verfügbar und technisch überraschend stark. Die Modelle Hunyuan-MT-7B und Hunyuan-MT-Chimera-7B übertreffen laut Benchmarks etablierte Systeme wie Google Translate und GPT-4.1. Besonders bemerkenswert: Trotz ihrer kompakten Größe liefern sie in fast allen Sprachkombinationen die besten Ergebnisse. NEWS Hohe Trefferquote in internationalen Benchmarks Bei der diesjährigen WMT25, einem der wichtigsten Vergleichstests für Übersetzungssysteme, erreichen die neuen Tencent-Modelle in 30 von 31 Sprachpaaren die höchsten Bewertungen. Getestet wurde die Übersetzungsqualität zwischen 33 Sprachen – von Chinesisch, Englisch und Spanisch bis hin zu selten digitalisierten Sprachen wie Isländisch, Estnisch oder Marathi. Ein besonderer Fokus liegt auf der Übersetzung zwischen Mandarin-Chinesisch und den Minderheitensprachen Chinas. Dazu zählen Kasachisch, Uigurisch, Mongolisch und Tibetisch. Gerade in diesen Kombinationen schneiden die Modelle deutlich besser ab als bestehende Systeme. In einigen Fällen liegt die Übersetzungsqualität mehr als 50 Prozent über den bisher besten Werten. + Quelle: Tencent Kompakte Technik mit ungewöhnlicher Trainingsmethode Beide Modelle basieren auf nur 7 Milliarden Parametern – deutlich weniger als viele der aktuellen Großmodelle. Trotzdem erreichen sie gleichwertige oder bessere Resultate. Möglich macht das ein mehrstufiges Trainingsverfahren, das klassische Methoden mit Belohnungslernen kombiniert. Dabei wurde unter anderem ein riesiger Datensatz speziell für seltene Sprachen genutzt, um die Modelle gezielt zu stärken. Das Modell Chimera-7B geht noch einen Schritt weiter: Es kombiniert mehrere Übersetzungsvorschläge zu einer optimierten Fassung. Dieser sogenannte Fusionsansatz führt laut internen Tests zu rund zwei Prozent besseren Ergebnissen im Vergleich zu Einzelmodellen – vor allem bei längeren und komplexeren Sätzen. Open Source und vielseitig einsetzbar Tencent stellt beide Modelle frei auf Hugging Face zur Verfügung. Der komplette Quellcode ist zusätzlich auf GitHub abrufbar. Durch ihre geringe Größe lassen sich die Modelle auch mit begrenzter Hardware nutzen – etwa in Forschungseinrichtungen, Startups oder auf Edge-Geräten. Die Veröffentlichung kommt zu einem Zeitpunkt, an dem auch Google seine Übersetzungs-KI modernisiert. Doch während dort neue Funktionen wie Live-Übersetzung und Sprachtraining im Vordergrund stehen, richtet sich Tencents Ansatz eher an Entwickler, die leistungsstarke und anpassbare Übersetzungssysteme benötigen – ohne Lizenzkosten und mit voller Kontrolle über die Technik. DEIN VORTEIL - DEINE HILFE Kostenlose News und Tutorials – mit minimaler Werbung und maximalem Mehrwert. Damit das so bleibt und wir uns stetig verbessern können, freuen wir uns über deine Unterstützung. Teile diesen Beitrag Folge uns auf Social Media Keine KI-News mehr verpassen und direkt kommentieren! Mastodon X Bluesky Facebook LinkedIn Youtube Unterstütze uns direkt Mit einer YouTube-Mitgliedschaft (ab 0,99 €) oder einmalig über PayPal. So helft ihr uns, unabhängig neue Tools zu testen und noch mehr Tutorials für euch zu erstellen. Vielen Dank für euren Support! Youtube - Kanal PayPal - Kaffee KURZFASSUNG
    Tencent hat zwei neue Open-Source-Übersetzungsmodelle veröffentlicht, die in 30 von 31 Sprachpaaren die WMT25-Benchmarks anführen.
    Die Modelle decken 33 Sprachen ab, inklusive wenig digitalisierter Sprachen wie Kasachisch, Uigurisch oder Tibetisch.
    Ein Ensemble-Ansatz namens Chimera verbessert die Übersetzungsqualität durch Systemfusion um mehrere Prozentpunkte.
    Mit nur 7 Milliarden Parametern sind die Modelle leichtgewichtig und effizient, bei gleichzeitig hoher Genauigkeit.
    QUELLEN
    Hugging Face – Hunyuan-MT-Chimera-7B
    Hugging Face – Hunyuan-MT-7B
    GitHub – Hunyuan-MT Repo
    The Verge – Google Translate Neuerungen
    9to5Google – AI-Features für Google Translate

    Weiterlesen...
Lädt...