bash のコードの (空白以外の) 行を数える

https://stackoverflow.com/questions/114814

02-07-2019
|

質問

Bash では、プロジェクト内の空白以外のコード行の数をどのように数えればよいですか?

解決

cat foo.c | sed '/^\s*$/d' | wc -l

コメントの空白行を考慮すると、次のようになります。

cat foo.pl | sed '/^\s*#/d;/^\s*$/d' | wc -l

ただし、それは言語に依存します。

他のヒント

#!/bin/bash
find . -path './pma' -prune -o -path './blog' -prune -o -path './punbb' -prune -o -path './js/3rdparty' -prune -o -print | egrep '\.php|\.as|\.sql|\.css|\.js' | grep -v '\.svn' | xargs cat | sed '/^\s*$/d' | wc -l

上記により、プロジェクト (現在のフォルダーとすべてのサブフォルダーを再帰的に) のコードの総行数 (空白行が削除されたもの) が得られます。

上記の「./blog」「./punbb」「./js/3rdparty」「./pma」はコードを書いていないのでブラックリストに入れているフォルダーです。また、.php、.as、.sql、.css、.js は、調べられているファイルの拡張子です。異なる拡張子を持つファイルは無視されます。

シェルスクリプト以外のものを使用したい場合は、次のことを試してください。クロック:

CLOCは、多くのプログラミング言語で空白行、コメントライン、ソースコードの物理行をカウントします。PERL v5.6以外の標準分布以外の依存関係なしで完全にPerlで記述されています（一部の外部モジュールからのコードはCLOC内に埋め込まれています）、非常に携帯用です。

これを行うには、一般的なシェルユーティリティを使用するさまざまな方法があります。

私の解決策は次のとおりです。

grep -cve '^\s*$' <file>

これは、<file> 内の行を検索します。パターン (-e) '^\s*$' に一致する、一致しない (-v) 行、行の先頭に 0 個以上の空白文字が続き、その後に行末まで (つまり、空白以外の内容はありません)、一致する行自体の代わりに一致する行の数を表示します (-c)。

パイプを使用する方法と比較したこの方法の利点 wc, 、複数のファイルを指定して、ファイルごとに個別のカウントを取得できることです。

$ grep -cve '^\s*$' *.hh

config.hh:36
exceptions.hh:48
layer.hh:52
main.hh:39

「wc」は行、単語、文字をカウントするため、すべての行 (空白行を含む) をカウントするには、次のコマンドを使用します。

wc *.py

空行をフィルタリングして除外するには、grep を使用できます。

grep -v '^\s*$' *.py | wc

'-v'は、 '^'が行の開始であるものを除くすべての行を出力するようにgrepに指示します ' s *'はゼロ以上のホワイトスペース文字 '$'は行の終わりです。カウントしたいすべてのファイル（現在のdirのすべてのPythonファイル）パイプ出力WCへ。出発します。

私は私自身の（本物の）質問に答えています。これをカバーした stackoverflow エントリが見つかりませんでした。

このコマンドは、空白以外の行の数をカウントします。
cat fileName | grep -v ^$ | wc -l
grep -v ^$ 正規表現関数は空白行を無視します。

cat 'filename' | grep '[^ ]' | wc -l

うまくいくはずです

grep -cvE '(^\s*[/*])|(^\s*$)' foo

-c = count
-v = exclude
-E = extended regex
'(comment lines) OR (empty lines)'
where
^    = beginning of the line
\s   = whitespace
*    = any number of previous characters or none
[/*] = either / or *
|    = OR
$    = end of the line

他の選択肢では私にとって間違った答えが得られたため、これを投稿しました。これは、コメント行が / または * で始まる Java ソースで機能しました (複数行コメントのすべての行で * を使用しています)。

awk '/^[[:space:]]*$/ {++x} END {print x}' "$testfile"

これは、プロジェクト内のコードの行数をカウントする Bash スクリプトです。ソースツリーを再帰的に走査し、空白行と「//」を使用する単一行のコメントを除外します。

# $excluded is a regex for paths to exclude from line counting
excluded="spec\|node_modules\|README\|lib\|docs\|csv\|XLS\|json\|png"

countLines(){
  # $total is the total lines of code counted
  total=0
  # -mindepth exclues the current directory (".")
  for file in `find . -mindepth 1 -name "*.*" |grep -v "$excluded"`; do
    # First sed: only count lines of code that are not commented with //
    # Second sed: don't count blank lines
    # $numLines is the lines of code
    numLines=`cat $file | sed '/\/\//d' | sed '/^\s*$/d' | wc -l`

    # To exclude only blank lines and count comment lines, uncomment this:
    #numLines=`cat $file | sed '/^\s*$/d' | wc -l`

    total=$(($total + $numLines))
    echo "  " $numLines $file
  done
  echo "  " $total in total
}

echo Source code files:
countLines
echo Unit tests:
cd spec
countLines

出力は次のようになります私のプロジェクト:

Source code files:
   2 ./buildDocs.sh
   24 ./countLines.sh
   15 ./css/dashboard.css
   53 ./data/un_population/provenance/preprocess.js
   19 ./index.html
   5 ./server/server.js
   2 ./server/startServer.sh
   24 ./SpecRunner.html
   34 ./src/computeLayout.js
   60 ./src/configDiff.js
   18 ./src/dashboardMirror.js
   37 ./src/dashboardScaffold.js
   14 ./src/data.js
   68 ./src/dummyVis.js
   27 ./src/layout.js
   28 ./src/links.js
   5 ./src/main.js
   52 ./src/processActions.js
   86 ./src/timeline.js
   73 ./src/udc.js
   18 ./src/wire.js
   664 in total
Unit tests:
   230 ./ComputeLayoutSpec.js
   134 ./ConfigDiffSpec.js
   134 ./ProcessActionsSpec.js
   84 ./UDCSpec.js
   149 ./WireSpec.js
   731 in total

楽しむ！--カラン

それはプロジェクト内のファイルの数に多少依存します。理論的には使用できます

grep -c '.' <list of files>

検索ユーティリティを使用してファイルのリストを入力できる場所。

grep -c '.' `find -type f`

ファイルごとの行数が表示されます。

現在のディレクトリ内の特定のファイル拡張子を持つ空白以外の行をすべて再帰的にカウントするスクリプト:

#!/usr/bin/env bash
(
echo 0;
for ext in "$@"; do
    for i in $(find . -name "*$ext"); do
        sed '/^\s*$/d' $i | wc -l ## skip blank lines
        #cat $i | wc -l; ## count all lines
        echo +;
    done
done
echo p q;
) | dc;

使用例:

./countlines.sh .py .java .html

プロジェクト全体の特定のファイル拡張子のすべてのファイルの空白以外の行の合計が必要な場合は、次のようにします。

while read line
do grep -cve '^\s*$' "$line"
done <  <(find $1 -name "*.$2" -print) | awk '{s+=$1} END {print s}'

最初の引数はプロジェクトのベースディレクトリ、2 番目はファイル拡張子です。使用例:

./scriptname ~/Dropbox/project/src java

これは、以前のソリューションを集めたものにすぎません。

grep -v '^\W*$' `find -type f` | grep -c '.' > /path/to/lineCountFile.txt

現在のディレクトリとそのサブディレクトリ内のすべてのファイルの合計数を示します。

ひーっ！

これは、空白行をカウントせずに行数をカウントします。

grep -v ^$ filename wc -l | sed -e 's/ //g'

rgrep . | wc -l

現在の作業ディレクトリ内の空白以外の行の数を示します。

Linux には、「wc」と呼ばれるこのためのプログラムがすでにあります。

ただ

wc -l *.c

合計行数と各ファイルの行数が表示されます。

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow