Преобразование xml из UTF-16 в UTF-8 с помощью PowerShell
-
09-09-2019 - |
Вопрос
Какой самый простой способ преобразовать XML из UTF16 в файл в кодировке UTF8?
Решение
Возможно, это не самый оптимальный вариант, но он работает.Просто загрузите XML-файл и переместите его обратно в файл.однако заголовок xml потерян, поэтому его необходимо добавить повторно.
$files = get-ChildItem "*.xml"
foreach ( $file in $files )
{
[System.Xml.XmlDocument]$doc = new-object System.Xml.XmlDocument;
$doc.set_PreserveWhiteSpace( $true );
$doc.Load( $file );
$root = $doc.get_DocumentElement();
$xml = $root.get_outerXml();
$xml = '<?xml version="1.0" encoding="utf-8"?>' + $xml
$newFile = $file.Name + ".new"
Set-Content -Encoding UTF8 $newFile $xml;
}
Другие советы
Ну, я думаю, самый простой способ - это просто не заботиться о том, является файл XML или нет, и просто конвертировать:
Get-Content file.foo -Encoding Unicode | Set-Content -Encoding UTF8 newfile.foo
Это будет работать только для XML, когда нет
<?xml version="1.0" encoding="UTF-16"?>
линия.
Попробуйте это решение, которое использует XmlWriter
:
$encoding="UTF-8" # most encoding should work
$files = get-ChildItem "*.xml"
foreach ( $file in $files )
{
[xml] $xmlDoc = get-content $file
$xmlDoc.xml = $($xmlDoc.CreateXmlDeclaration("1.0",$encoding,"")).Value
$xmlDoc.save($file.FullName)
}
Возможно, вы захотите взглянуть на XMLDocument
для получения дополнительных разъяснений по CreateXmlDeclaration
.
Не связан с StackOverflow