Reklame

이 웹사이트에 환영. 이것은 보기 원본이다

Hvilket sprog er dette? Kinesisk? japansk?

Det er faktisk koreansk. At opdage dette manuelt ville have taget mig meget tid. Heldigvis fandt jeg nogle meget præcise værktøjer, der kan gøre dette automatisk. De er alle listet nedenfor.

Eksperimentet: Jeg testede webstederne ved at bruge eksempeltekst (1-2 sætninger med 8 ord) fra følgende sprog: portugisisk, russisk, koreansk, vietnamesisk, italiensk, Tyrkisk, polsk, ukrainsk, aserbajdsjansk, slovensk, makedonsk, hollandsk, filippinsk (tagalog), græsk, galicisk, tjekkisk, hviderussisk, finsk, tatarisk og Norsk.

Samlet set testede jeg 20 forskellige sprog.

3 værktøjer til at registrere ukendt sprogtekst

1. LangId (bestod 18 ud af 20 prøver, bestod ikke tatarisk og hviderussisk)

lang-id

Fordele: Samlet set fantastisk online værktøj. Det tilbyder grundlæggende tekstgenkendelsesfunktionalitet, og det har de også Twitter og e-mail-detektionsbots for endnu hurtigere resultater.

Ulemper: Deres motor er baseret på Google API, men de ser ud til at have bedre resultater end Google-detektoren beskrevet nedenfor. Det lader til, at de ved, hvordan man bruger tingene meget godt. Jeg kunne ikke lide, at de ikke har deres egen unikke algoritme til at opdage sprog.

instagram viewer

2. Google Sprogdetektor [Ikke længere tilgængelig] (bestod 17 ud af 20 prøver, bestod ikke portugisisk, taglog og hviderussisk)

Hvilket sprog er dette

Fordele: Google har en af ​​verdens bedste API til sprogdetektion. Den gode ting er, at du er i stand til at se sandsynligheden for, at resultatet, de viser, er sandt. De var i stand til at bestå de fleste prøveprøver.

Ulemper: Jeg var ret overrasket over, at de ikke bestod den portugisiske prøve. Det ser ud til, at de har en (forhåbentlig midlertidig) fejl med dette sprog. Også de kan helt sikkert gøre et bedre stykke arbejde med at gøre sidedesignet bedre.

3. Hvilket sprog er dette (bestod 11 ud af 20 prøver, bestod ikke russisk, koreansk, ukrainsk, aserbajdsjansk, makedonsk, tagalog, græsk, galicisk og tatarisk)

Hvilket sprog er dette

Fordele: Nogle sprog som de sydslaviske (serbisk, kroatisk, slovensk) er ret ens. Hvis du indtaster en kroatisk tekst, lad os sige, at denne hjemmeside vil fortælle dig, at teksten også kan være serbisk eller slovensk.

Ulemper: De skal arbejde på at gøre deres detektionssystem mere sofistikeret. Jeg tænkte på at sætte Translated.net (en anden hjemmeside til sprogdetektion) i stedet for denne, men Translated lovede opdagelse af flere sprog og gjorde det faktisk værre end WhatLanguageIsThis.com.

2 værktøjer til at opdage websteder på ukendte sprog

4. Google Oversæt med Find sprog som den første mulighed

Bestået: 18 ud af 20, bestod ikke hviderussisk og tatarisk.

Fordele: Dette værktøj gør sit arbejde meget godt. Det jeg godt kan lide ved Google Oversæt Google Translate 2.1 dukker op med indbygget iOS 7-tastatur og mere sprogunderstøttelseOpdater til Google Translate 2.1 på din iOS-enhed, og medbring understøttelse af oversættelse og håndskriftsindtastning til nye sprog. Google Translate får endelig et nyt iOS 7-tastatur til at gøre alt... Læs mere er, at hvis det ikke understøtter et bestemt sprog, giver det dig følgende skærm:

Identificer ukendte sprog

Det er en fantastisk sprogdetektor, hvis du spørger mig!

5. Microsoft Bing-oversætter med Finde pr. automatik som den første mulighed.

bing-oversætter

Bestået: 8 ud af 20, bestod ikke hollandsk, vietnamesisk, tyrkisk, ukrainsk, aserbajdsjansk, slovensk, makedonsk, tagalog, græsk, galicisk, tjekkisk og hviderussisk

Fordele: Det understøtter et begrænset antal sprog. For disse sprog gør det sit arbejde godt.

Ulemper: Jeg er meget skuffet over Microsoft. De har et meget begrænset antal sprog til detektion& oversættelse Glem Google Translate: 3 måder at få en nøjagtig, hurtig oversættelse påUanset om du planlægger at ansøge om et job eller en lejlighed i udlandet, eller søger at oversætte din webside, skal du have styr på tingene selv med et fremmedsprog. Læs mere og deres Auto-Detect-funktion er forfærdelig. Hvis du indtaster et sprog, de ikke understøtter, får du et forkert resultat i stedet for at fortælle dig, at de ikke understøtter det sprog.

tanker

Samlet set er min mening, at ovenstående værktøjer er på vej i en god retning. De er i øjeblikket de bedste til at opdage sprog online og gør deres arbejde ret godt, når det kommer til populære sprog. De skal dog arbejde på at tilføje mere obskure sprog (ingen af ​​værktøjerne var i stand til at genkende tatarisk), og jeg er sikker på, at dem alle, især Google, vil gå i den retning i nær fremtid.

Billedkredit: Kanko*

Mit navn er Darko (kaldenavn Darren.) Jeg kan godt lide Web 2.0, at skabe nichewebsteder (mit seneste projekt er People Search) og så videre...hvad kan jeg ellers sige om mig i sådan en kort profil, følg min på Twitter hvis du vil finde ud af mere :)