Regras de segmentação para idiomas não latinos, como chinês e japonês
-
23-09-2019 - |
Pergunta
Ao explorar globalsight.com, me deparei com as regras de segmentação (link). Ele usa ponto final (.) como delimitador de idioma.Quais regras de segmentaion podemos usar para segmentar os idiomas não baseados em latim para os quais um ponto (.) significa algo diferente de um delimitador ou para os idiomas que não têm nenhum exemplo de delimitadores - chineses, japoneses e coreanos
Quais são as regras de segmentação linguística utilizadas para estas línguas “não latinas” (chinês, japonês)?Como são desenvolvidas as regras de segmentação?
Agradecemos antecipadamente, Manjushree
Nenhuma solução correta
Outras dicas
Usos japoneses Kinsoku Shori. Não tenho certeza sobre os outros dois.
Trados, o principal aplicativo de memória de tradução, usa as seguintes regras de segmentação:
Para japoneses e chineses:
Ponto final: 。
Dois pontos: ::
Pontuação: ?!?!