Pergunta

Ao explorar globalsight.com, me deparei com as regras de segmentação (link). Ele usa ponto final (.) como delimitador de idioma.Quais regras de segmentaion podemos usar para segmentar os idiomas não baseados em latim para os quais um ponto (.) significa algo diferente de um delimitador ou para os idiomas que não têm nenhum exemplo de delimitadores - chineses, japoneses e coreanos

Quais são as regras de segmentação linguística utilizadas para estas línguas “não latinas” (chinês, japonês)?Como são desenvolvidas as regras de segmentação?

Agradecemos antecipadamente, Manjushree

Nenhuma solução correta

Outras dicas

Usos japoneses Kinsoku Shori. Não tenho certeza sobre os outros dois.

Trados, o principal aplicativo de memória de tradução, usa as seguintes regras de segmentação:

Para japoneses e chineses:

Ponto final:

Dois pontos: ::

Pontuação: ?!?!

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top