Your code is fine. python
simply stores its special characters like that. If you print out your text, you will still get the original strings:
s = 'Udtræk fra observatør på årstal'
s = s.split()
for i in s:
print i
[OUTPUT] #all fine
Udtræk
fra
observatør
på
årstal