Quelle langue est-ce? 5 outils pour identifier des langues inconnues

ì ?? `ì> ¹ì,¬ì ??`트ì- ?? í ™ ~ì~ ??. ì ??`것ì ?? € ë³`ê¸ ° ì> ?? 본ì ??`e <¤

Quelle langue est-ce? Chinois? Japonais?

Il est en fait coréenne. Détecter cela manuellement dû me prendre beaucoup de temps. Heureusement, j`ai trouvé quelques outils très précis qui peuvent le faire automatiquement. Ils sont tous énumérés ci-dessous.

L`expérience: Je l`ai testé les sites Web en utilisant un exemple de texte (1-2 phrases avec 8 mots) des langues suivantes: portugais, russe, coréen, vietnamien, italien, turc, polonais, ukrainien, azerbaïdjanais, slovène, macédonien, néerlandais, philippin (tagalog), grec, galicien, tchèque, biélorusse, finnois, norvégien et tatare.

Dans l`ensemble, je l`ai testé 20 langues différentes.

3 outils pour détecter Text Language Unknown

1. lANGID (Passé 18 sur 20 essais, n`a pas été adopté Tatar et biélorusses)

lang-id

Avantages: Dans l`ensemble, outil en ligne. Il offre des fonctionnalités de détection de texte de base et ils ont aussi Gazouillement et les robots collecteurs email-détection pour des résultats encore plus rapides.

Les inconvénients: Leur moteur est basé sur l`API Google mais ils semblent avoir de meilleurs résultats que le détecteur Google décrit ci-dessous. Il semble qu`ils savent comment utiliser les choses très bien. Je n`aimais pas qu`ils ne disposent pas de leur propre algorithme unique pour détecter les langues.

2. Google Language Detector (Passé 17 des 20 tests, ne passe pas le portugais, TAGLOG et biélorusses)

Quelle langue est-ce

Avantages: Google a l`un des meilleurs API pour la détection de la langue du monde. Ils bonne chose est que vous êtes en mesure de voir la probabilité du résultat qu`ils affichage étant vrai. Ils ont pu passer la plupart des tests d`échantillons.

Les inconvénients: J`ai été très surpris qu`ils ne passent pas le test portugais. Il semble qu`ils ont un (je l`espère temporaire) bug avec cette langue. En outre, ils peuvent certainement faire un meilleur travail à faire mieux la conception de page.

3. Quelle langue est-ce (Passé 11 des 20 tests, ne passe pas russe, coréen, ukrainien, l`Azerbaïdjan, le macédonien, le tagalog, le grec, le galicien et le tatar)

Quelle langue est-ce

Avantages: Certaines langues comme celles slaves du sud (serbe, croate, slovène) sont assez similaires. Si vous entrez un texte croate, disons, ce site vous dira que le texte pourrait aussi être serbe ou slovène.

Les inconvénients: Ils doivent travailler à rendre leur système de détection plus sophistiqué. Je pensais à mettre Translated.net (un autre site pour la détection de la langue) au lieu de celui-ci, mais la détection TRADUIT promis de plusieurs langues et fait réellement pire que WhatLanguageIsThis.com.

2 Outils Pour détecter les sites Web dans Unknown Langues

4. Google Traduction avec détecter la langue comme la première option

Video: Chinois, Japonais ou Coréen ? Quelle langue choisir, quelles différences?

passé: 18 sur 20, n`a pas été adopté et Belorussian Tatar.

Avantages: Cet outil fait très bien son travail. La chose que j`aime Google Traduction est que si elle ne supporte pas une langue spécifique, il vous donne l`écran suivant:

Video: DMT La molécule de l'esprit - VOSTFR

Identifier les langues inconnues

C`est un détecteur de langue si vous me demandez!

5. Traducteur Microsoft Bing avec Détection automatique comme la première option.

Traducteur Bing

passé: 8 sur 20, ne passe pas néerlandais, vietnamien, turc, ukrainien, azerbaïdjanais, slovène, le macédonien, le tagalog, le grec, le galicien, tchèque et biélorusses

Avantages: Il prend en charge un nombre limité de langues. Pour les langues, il fait bien son travail.

Les inconvénients: Je suis très déçu par Microsoft. Ils ont un nombre très limité de langues pour la détection& Traduction et leur fonction Auto-détection est terrible. Si vous entrez dans une langue qu`ils ne prennent pas en charge, vous obtiendrez un mauvais résultat au lieu de vous dire qu`ils ne prennent pas en charge cette langue.Top 4 Services de traduction en ligneTop 4 Services de traduction en ligneLire la suite

Pensées

Dans l`ensemble, mon avis est les outils ci-dessus se dirigent dans la bonne direction. Ils sont actuellement les meilleurs pour détecter des langues en ligne et font très bien leur travail en matière de langues populaires. Cependant, ils doivent travailler sur l`ajout de langues obscures (aucun des outils ont été en mesure de reconnaître Tatar) et je suis sûr que tous, en particulier Google ira dans cette direction dans un avenir proche.

Articles connexes