Det sker, at vi står over for, atteksten er skrevet på et sprog vi ikke kender. Endnu trit på importerede varer skrevet på et uforståeligt sprog, men du vil gerne vide sammensætningen af ​​produktet, produktet. Det er klart, at vi kender de sprog, vi let kan skelne mellem, det betyder engelsk, tysk. Så er spørgsmålet, hvordan man bestemmer sprogets sprog, hvis man møder sådanne symboler for første gang.

Selvfølgelig kan du spørge eksperterne, somforstå de forskellige sprog i verden, men hvorfor, hvis nu alle har en internetforbindelse, hvor du kan finde automatiske sprogdetektorer. Dette refererer til specielle programmer, der bestemmer sprogets sprog. Så hvordan bestemmer du hvilket sprog der bruges i teksten med programmer? Vi vil forsøge at forklare handlingsalgoritmen, det vil sige, hvordan programmer definerer et bestemt sprog.

Enhver identifikator af sproget, ifølge flere indtastedeord, kan navngive sproget. Dette gøres ved at matche ord med en ordbog, der er syet ind i programmet. Mere specifikt sker dette for eksempel: Teksten du indtastede i programfeltet er opdelt i ord, der igen overgår definitionen til at falde sammen med ord fra forskellige sprog, hvilket resulterer i, at du modtager en anmeldelse med en liste over et eller flere sprog, der maksimerer pasform. Selvfølgelig er arbejdet i et sådant program ikke så enkelt som det forekommer ved første øjekast, fordi du skal tage højde for leksikalsk udfyldning af teksten, opbygningen af ​​sætningen, derfor kan disse programmer kun bruges i en omtrentlig analyse af teksten. Her er de hyppigst anvendte programmer: "Polyglot 3000", "Xerox", "TextCat".

Nu ved du, hvordan du definerer sprogets sprog ved hjælp af et særligt program.

Kommentarer 0