我打电话给一个有趣的API返回字阵列,但我希望有一个文本流。是有一个简单的方法来获得一个文本流从一个字节阵?现在我只是扔在一起:

(defun bytearray-to-string (bytes)
  (let ((str (make-string (length bytes))))
    (loop for byte across bytes
       for i from 0
       do (setf (aref str i) (code-char byte)))
    str))

然后包裹的结果在与输入从字,但这不可能是最好的方式。(此外,它的可怕的效率低下。)

在这种情况下,我知道,它总是ASCII,以解释它为ASCII或UTF-8会被罚款。我使用Unicode-知道SBCL,但我更喜欢一个便携式(即使ASCII-only)解决SBCL-Unicode的具体的一个。

有帮助吗?

解决方案

FLEXI-STREAMS( http://weitz.de/flexi-streams/ )具有便携性转换功能

(flexi-streams:octets-to-string #(72 101 108 108 111) :external-format :utf-8)

=>

"Hello"

或者,如果你想要一个流:

(flexi-streams:make-flexi-stream
   (flexi-streams:make-in-memory-input-stream
      #(72 101 108 108 111))
   :external-format :utf-8)

将返回一个从byte-vector

读取文本的流

其他提示

有两个便携式图书馆为这种转换:

  • flexi-流,已经提到另一个答案。

    这个图书馆是老年人和具有更多的功能,尤其可扩展的流。

  • 巴别塔, 图书馆specificially字符编码和解码

    主要利用巴别通过灵活的流速度。

为了最好的性能,使用Babel如果有你需要的功能,并回落到灵活的流。下一个(此不科学的)说明基准测试的速度差别。

对这个测试的情况下,Babel是 337倍的速度 和需要200倍的存储器。

(asdf:operate 'asdf:load-op :flexi-streams)
(asdf:operate 'asdf:load-op :babel)

(defun flexi-streams-test (bytes n)
  (loop
     repeat n
     collect (flexi-streams:octets-to-string bytes :external-format :utf-8)))

(defun babel-test (bytes n)
  (loop
     repeat n
     collect (babel:octets-to-string bytes :encoding :utf-8)))

(defun test (&optional (data #(72 101 108 108 111))
                       (n 10000))
  (let* ((ub8-vector (coerce data '(simple-array (unsigned-byte 8) (*))))
         (result1 (time (flexi-streams-test ub8-vector n)))
         (result2 (time (babel-test ub8-vector n))))
    (assert (equal result1 result2))))

#|
CL-USER> (test)
Evaluation took:
  1.348 seconds of real time
  1.328083 seconds of user run time
  0.020002 seconds of system run time
  [Run times include 0.12 seconds GC run time.]
  0 calls to %EVAL
  0 page faults and
  126,402,160 bytes consed.
Evaluation took:
  0.004 seconds of real time
  0.004 seconds of user run time
  0.0 seconds of system run time
  0 calls to %EVAL
  0 page faults and
  635,232 bytes consed.
|#

如果您不必担心UTF-8编码(实际上,这意味着“只是普通的ASCII”),您可以使用MAP:

(map'string#'code-char#(72 101 108 108 111))

我说使用拟议的flexistream或babel解决方案。

但是为了完整性和未来googlers到达此页面的好处,我想提一下sbcl自己的sb-ext:octets-to-string:

   SB-EXT:OCTETS-TO-STRING is an external symbol in #<PACKAGE "SB-EXT">.
   Function: #<FUNCTION SB-EXT:OCTETS-TO-STRING>
   Its associated name (as in FUNCTION-LAMBDA-EXPRESSION) is
     SB-EXT:OCTETS-TO-STRING.
   The function's arguments are:  (VECTOR &KEY (EXTERNAL-FORMAT DEFAULT) (START 0)
                                          END)
   Its defined argument types are:
     ((VECTOR (UNSIGNED-BYTE 8)) &KEY (:EXTERNAL-FORMAT T) (:START T) (:END T))
   Its result type is:
     *

SBCL支持所谓的 Gray Streams 。这些是基于CLOS类和通用函数的可扩展流。您可以创建一个文本流子类,从字节数组中获取字符。

尝试 FORMAT 功能。 (FORMAT NIL ...)将结果作为字符串返回。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top