解析パフォーマンス(If、TryParse、Try-Catch)
質問
情報の解析テキストを処理するさまざまな方法について、私はよく知っています。たとえば、整数の解析では、どのようなパフォーマンスが期待できますか。誰もこれに関する良い統計を知っているのだろうかと思います。これをテストした人から実際の数字を探しています。
これらのうち、どの状況で最高のパフォーマンスを提供するのはどれですか?
Parse(...) // Crash if the case is extremely rare .0001%
If (SomethingIsValid) // Check the value before parsing
Parse(...)
TryParse(...) // Using TryParse
try
{
Parse(...)
}
catch
{
// Catch any thrown exceptions
}
解決
常に T.TryParse(string str、out T value)を使用します。例外をスローするのはコストがかかるため、事前に状況を処理できる場合は避ける必要があります。 try-catchブロックを使用して「保存」する無効なデータレートが低いためにパフォーマンスが低下するのは、保守性と優れたコーディングプラクティスを犠牲にして例外処理を悪用することです。健全なソフトウェアエンジニアリング開発プラクティスに従い、テストケースを作成し、アプリケーションを実行し、ベンチマークを行い、最適化します。
"小さな効率については忘れてください。たとえば、約97%の時間です。時期尚早な最適化がすべての悪の根源です。しかし、その重要な3%の機会を逃してはなりません。 -ドナルド・クヌース
したがって、カーボンクレジットのように、try-catchのパフォーマンスが悪いであり、TryParseのパフォーマンスが better であることを割り当てます。アプリケーションを実行し、ある種のスローダウンがあると判断した後にのみ。文字列解析では、TryParse以外の使用も検討します。
(編集:質問者はタイミングデータに適切なアドバイスを求めているように見えるので、ここに要求されるタイミングデータがあります)
ユーザーからの10,000入力に対するさまざまな失敗率の時間(未信者の場合):
Failure Rate Try-Catch TryParse Slowdown
0% 00:00:00.0131758 00:00:00.0120421 0.1
10% 00:00:00.1540251 00:00:00.0087699 16.6
20% 00:00:00.2833266 00:00:00.0105229 25.9
30% 00:00:00.4462866 00:00:00.0091487 47.8
40% 00:00:00.6951060 00:00:00.0108980 62.8
50% 00:00:00.7567745 00:00:00.0087065 85.9
60% 00:00:00.7090449 00:00:00.0083365 84.1
70% 00:00:00.8179365 00:00:00.0088809 91.1
80% 00:00:00.9468898 00:00:00.0088562 105.9
90% 00:00:01.0411393 00:00:00.0081040 127.5
100% 00:00:01.1488157 00:00:00.0078877 144.6
/// <param name="errorRate">Rate of errors in user input</param>
/// <returns>Total time taken</returns>
public static TimeSpan TimeTryCatch(double errorRate, int seed, int count)
{
Stopwatch stopwatch = new Stopwatch();
Random random = new Random(seed);
string bad_prefix = @"X";
stopwatch.Start();
for(int ii = 0; ii < count; ++ii)
{
string input = random.Next().ToString();
if (random.NextDouble() < errorRate)
{
input = bad_prefix + input;
}
int value = 0;
try
{
value = Int32.Parse(input);
}
catch(FormatException)
{
value = -1; // we would do something here with a logger perhaps
}
}
stopwatch.Stop();
return stopwatch.Elapsed;
}
/// <param name="errorRate">Rate of errors in user input</param>
/// <returns>Total time taken</returns>
public static TimeSpan TimeTryParse(double errorRate, int seed, int count)
{
Stopwatch stopwatch = new Stopwatch();
Random random = new Random(seed);
string bad_prefix = @"X";
stopwatch.Start();
for(int ii = 0; ii < count; ++ii)
{
string input = random.Next().ToString();
if (random.NextDouble() < errorRate)
{
input = bad_prefix + input;
}
int value = 0;
if (!Int32.TryParse(input, out value))
{
value = -1; // we would do something here with a logger perhaps
}
}
stopwatch.Stop();
return stopwatch.Elapsed;
}
public static void TimeStringParse()
{
double errorRate = 0.1; // 10% of the time our users mess up
int count = 10000; // 10000 entries by a user
TimeSpan trycatch = TimeTryCatch(errorRate, 1, count);
TimeSpan tryparse = TimeTryParse(errorRate, 1, count);
Console.WriteLine("trycatch: {0}", trycatch);
Console.WriteLine("tryparse: {0}", tryparse);
}
他のヒント
私は個人的にさまざまな方法を紹介していませんが、この章では次のことを行っています:
Try-Catchは常に遅くなります。 TryParseの方が高速です。
IFとTryParseは同じです。
パフォーマンスの違いもプロファイリングした別のチャップ、およびいくつかの異なるデータ型を使用して、それらが本質的にパフォーマンスにどれだけ影響するかを確認します:int、bool、DateTime。
Option 1: Will throw an exception on bad data.
Option 2: SomethingIsValid() could be quite expensive - particularly if you are pre-checking a string for Integer parsability.
Option 3: I like this. You need a null check afterwards, but it's pretty cheap.
Option 4 is definitely the worst.
例外処理は比較的高価なので、可能な場合は避けてください。
特に、不正な入力は例外ではなく予期されるため、このような状況では使用しないでください。
(ただし、TryParseの前は、最良のオプションだったかもしれません。)