문제
나는 아스키 문자의 시리즈로 제시 패스트큐 품질 점수를 가지고있다.이 경우(가능성)아스키 문자 64 에서 126 은 0 에서 62 까지의 점수를 나타냅니다.일루미나라고 가정하면).이것은 기본 순서를 발생시킵니다. :
feffefdfbefdfffcfdeTddaYddffbfcI`S_KKX_]]MR[D_TY[VTVXQ]`Q_BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB
어떻게 아스키 문자의 수를 추출 할 수 있습니까?
감사합니다 산
편집:이 염기서열은 염기서열로 구성된 생물학적 염기서열의 품질을 나타냅니다.기본 품질은 -10 로그 10 과 같은 기본 오류 확률입니다.
해결책
글쎄,마렉이 말했듯이 :당신은 바이오 컨덕터에서 일루미나 품질 점수를 변환하는 기능을 찾을 수 있습니다.당신은에 요청할 수 있습니다 biostar.stackexchange.com.
기본 함수를 사용하여 다음을 사용할 수 있습니다 charToRaw()
:
> x <- "feeffdbefc`\\KKX]_BBBB"
> charToRaw(x)
[1] 66 65 65 66 66 64 62 65 66 63 60 5c 4b 4b 58 5d 5f 42 42 42 42
> as.numeric(charToRaw(x))
[1] 102 101 101 102 102 100 98 101 102 99 96 92 75 75 88 93 95 66 66 66 66
> as.character(charToRaw(x))
[1] "66" "65" "65" "66" "66" "64" "62" "65" "66" "63" "60" "5c" "4b" "4b" "58" "5d" "5f" "42" "42" "42" "42"
당신을 마음,당신은 백 슬래시를 탈출해야합니다,또는 당신은 곤경에 얻을 것이다.그것은 당신이 당신의 데이터 등을 읽는 방법에 달려 있습니다.
제휴하지 않습니다 StackOverflow