最好在开始或结束时过滤数据流？

题

我正在开发一个项目，我需要处理大量（数千兆字节）逗号分隔值（CSV）文件。

我基本上做的如下：

我想知道在源端过滤是否更好，例如每个侦听器都有一个关联的Predicate对象，用于确定是否应将一段给定的数据分派给侦听器，在这种情况下，该进程看起来更像

净效果是相同的，只是过滤发生的地方。

（同样，我有这个'流'数据的唯一原因，我一次处理一个条目是因为我正在处理千兆字节的CSV文件，我无法创建一个集合，过滤它，以及然后处理它 - 我需要过滤掉）

解决方案

除非对侦听器的调用成本很高（Remoting，WCF，...），否则我会使用一个非常简单的界面，让听众决定如何处理该行。

许可以下： CC-BY-SA 和归因