質問

現時点では、ゼロからC ++をゼロから学ぼうとしています。
私はPython、Perl、JavaScriptに精通していますが、過去の教室の設定でC ++に短時間しか遭遇していません。私の質問の素朴さを許してください。

正規表現を使用して文字列を分割したいのですが、C ++でこれを行う方法の明確で決定的な、効率的で完全な例を見つけることはあまり運がありませんでした。

Perlでは、これはアクションが一般的であるため、些細な方法で達成できます。

/home/me$ cat test.txt
this is  aXstringYwith, some problems
and anotherXY line with   similar issues

/home/me$ cat test.txt | perl -e'
> while(<>){
>   my @toks = split(/[\sXY,]+/);
>   print join(" ",@toks)."\n";
> }'
this is a string with some problems
and another line with similar issues

C ++で同等物を達成するのが最善の方法を知りたいです。

編集:
以下に言及したように、ブーストライブラリで探していたものを見つけたと思います。

regex-token-iteratorをブーストします (なぜ強調しないのですか?)

何を探すべきかわからなかったと思います。


#include <iostream>
#include <boost/regex.hpp>

using namespace std;

int main(int argc)
{
  string s;
  do{
    if(argc == 1)
      {
        cout << "Enter text to split (or \"quit\" to exit): ";
        getline(cin, s);
        if(s == "quit") break;
      }
    else
      s = "This is a string of tokens";

    boost::regex re("\\s+");
    boost::sregex_token_iterator i(s.begin(), s.end(), re, -1);
    boost::sregex_token_iterator j;

    unsigned count = 0;
    while(i != j)
      {
        cout << *i++ << endl;
        count++;
      }
    cout << "There were " << count << " tokens found." << endl;

  }while(argc == 1);
  return 0;
}

役に立ちましたか?

解決

この場合、ブーストライブラリは通常良い選択です boost.regex. 。あります 既にあなたが望むことをしているトークンに文字列を分割するため。基本的にそれは次のようなものに帰着します:

boost::regex re("[\\sXY]+");
std::string s;

while (std::getline(std::cin, s)) {
  boost::sregex_token_iterator i(s.begin(), s.end(), re, -1);
  boost::sregex_token_iterator j;
  while (i != j) {
     std::cout << *i++ << " ";
  }
  std::cout << std::endl;
}

他のヒント

イテレーターの使用を最小限に抑え、コードを清算する場合は、次のように機能する必要があります。

#include <string>
#include <iostream>
#include <boost/regex.hpp>

int main()
{
  const boost::regex re("[\\sXY,]+");

  for (std::string s; std::getline(std::cin, s); ) 
  {
    std::cout << regex_replace(s, re, " ") << std::endl;   
  }

}

PERLとは異なり、正規表現はC ++に「組み込まれている」わけではありません。

外部ライブラリを使用する必要があります。 PCRE.

正規表現は、Visual C ++ 2008 SP1(Express Editionを含む)およびG ++ 4.3に含まれるTR1の一部です。

ヘッダーはです <regex> およびnamespace std :: tr1。 STLでうまく機能します。

C ++ TR1正規表現を開始します

Visual C ++標準ライブラリ:TR1正規表現

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top