Построение и отправка двоичных данных по сети
-
24-10-2019 - |
Вопрос
Я создаю клиента командной строки для Minecraft. На протоколе есть полная спецификация, которую можно найти здесь: http://mc.kev009.com/protocol. Анкет Чтобы ответить на ваш вопрос заранее, да, я немного C ++ Noob.
У меня есть различные проблемы в реализации этого протокола, из которого каждый критический.
- Протокол говорит, что все типы крупные. Я понятия не имею, как я должен проверить, являются ли мои данные с маленькими эндэдианскими и, если да, как конвертировать в Биг-Эндиан.
- Строка данных DataType немного странно. Это модифицированная строка UTF-8, которой предшествует короткая, содержащая длину строки. Я понятия не имею, как я должен упаковать это в простой массив, и как преобразовать мои простые строки в модифицированные UTF-8.
- Даже если бы я знал, как преобразовать свои данные в Big-Endian и создать модифицированные строки UTF-8, я до сих пор не знаю, как упаковать это в массив CHAR [] и отправить это в качестве пакета. Все, что я делал раньше, это простая сеть HTTP, которая является простым ASCII.
Объяснения, ссылки, связанные имена функций и короткие фрагменты очень ценят!
РЕДАКТИРОВАТЬ
1 и 3 отвечают сейчас. 1 отвечает ниже пользователя470379. 3 отвечает эта удивительная тема, которая объясняет, что я хочу сделать очень хорошо: http://cboard.cprogramming.com/networking-device-communication/68196-sending-non-char*-data.html Я еще не уверен насчет модифицированного UTF-8.
Решение
Традиционный подход заключается в определении структуры сообщений C ++ для каждого сообщения протокола и реализации функций сериализации и десериализации для него. Например Запрос входа в систему может быть представлен таким образом:
#include <string>
#include <stdint.h>
struct LoginRequest
{
int32_t protocol_version;
std::string username;
std::string password;
int64_t map_seed;
int8_t dimension;
};
Теперь требуются функции сериализации. Сначала нужны функции сериализации для целых чисел и строк, поскольку это типы членов в LoginRequest
.
Функции целочисленной сериализации должны выполнять преобразования в и из-за прежнего представления. Поскольку члены сообщения копируются в буфер и обратно, обращение байтового порядка может быть сделано при копировании:
#include <boost/detail/endian.hpp>
#include <algorithm>
#ifdef BOOST_LITTLE_ENDIAN
inline void xcopy(void* dst, void const* src, size_t n)
{
char const* csrc = static_cast<char const*>(src);
std::reverse_copy(csrc, csrc + n, static_cast<char*>(dst));
}
#elif defined(BOOST_BIG_ENDIAN)
inline void xcopy(void* dst, void const* src, size_t n)
{
char const* csrc = static_cast<char const*>(src);
std::copy(csrc, csrc + n, static_cast<char*>(dst));
}
#endif
// serialize an integer in big-endian format
// returns one past the last written byte, or >buf_end if would overflow
template<class T>
typename boost::enable_if<boost::is_integral<T>, char*>::type serialize(T val, char* buf_beg, char* buf_end)
{
char* p = buf_beg + sizeof(T);
if(p <= buf_end)
xcopy(buf_beg, &val, sizeof(T));
return p;
}
// deserialize an integer from big-endian format
// returns one past the last written byte, or >buf_end if would underflow (incomplete message)
template<class T>
typename boost::enable_if<boost::is_integral<T>, char const*>::type deserialize(T& val, char const* buf_beg, char const* buf_end)
{
char const* p = buf_beg + sizeof(T);
if(p <= buf_end)
xcopy(&val, buf_beg, sizeof(T));
return p;
}
И для струн (обработка модифицированный UTF-8 так же, как строки Asciiz):
// serialize a UTF-8 string
// returns one past the last written byte, or >buf_end if would overflow
char* serialize(std::string const& val, char* buf_beg, char* buf_end)
{
int16_t len = val.size();
buf_beg = serialize(len, buf_beg, buf_end);
char* p = buf_beg + len;
if(p <= buf_end)
memcpy(buf_beg, val.data(), len);
return p;
}
// deserialize a UTF-8 string
// returns one past the last written byte, or >buf_end if would underflow (incomplete message)
char const* deserialize(std::string& val, char const* buf_beg, char const* buf_end)
{
int16_t len;
buf_beg = deserialize(len, buf_beg, buf_end);
if(buf_beg > buf_end)
return buf_beg; // incomplete message
char const* p = buf_beg + len;
if(p <= buf_end)
val.assign(buf_beg, p);
return p;
}
И пара вспомогательных функторов:
struct Serializer
{
template<class T>
char* operator()(T const& val, char* buf_beg, char* buf_end)
{
return serialize(val, buf_beg, buf_end);
}
};
struct Deserializer
{
template<class T>
char const* operator()(T& val, char const* buf_beg, char const* buf_end)
{
return deserialize(val, buf_beg, buf_end);
}
};
Сейчас используя эти примитивные функции, мы можем легко сериализовать и покинуть LoginRequest
сообщение:
template<class Iterator, class Functor>
Iterator do_io(LoginRequest& msg, Iterator buf_beg, Iterator buf_end, Functor f)
{
buf_beg = f(msg.protocol_version, buf_beg, buf_end);
buf_beg = f(msg.username, buf_beg, buf_end);
buf_beg = f(msg.password, buf_beg, buf_end);
buf_beg = f(msg.map_seed, buf_beg, buf_end);
buf_beg = f(msg.dimension, buf_beg, buf_end);
return buf_beg;
}
char* serialize(LoginRequest const& msg, char* buf_beg, char* buf_end)
{
return do_io(const_cast<LoginRequest&>(msg), buf_beg, buf_end, Serializer());
}
char const* deserialize(LoginRequest& msg, char const* buf_beg, char const* buf_end)
{
return do_io(msg, buf_beg, buf_end, Deserializer());
}
Используя вспомогательные функторы выше и представляющие буферы ввода/вывода в качестве char
Итераторный диапазон требуется только один шаблон функции, чтобы выполнить как сериализацию, так и десериализацию сообщения.
И объединить все, использование:
int main()
{
char buf[0x100];
char* buf_beg = buf;
char* buf_end = buf + sizeof buf;
LoginRequest msg;
char* msg_end_1 = serialize(msg, buf, buf_end);
if(msg_end_1 > buf_end)
; // more buffer space required to serialize the message
char const* msg_end_2 = deserialize(msg, buf_beg, buf_end);
if(msg_end_2 > buf_end)
; // incomplete message, more data required
}
Другие советы
Для #1 вам нужно использовать ntohs
и друзья. Использовать *s
(короткие) версии для 16-битных целых чисел и *l
(длинные) версии для 32-битных целых чисел. А hton*
(Хост в сеть) будет преобразовать исходящие данные в Big-Endian, независимо ntoh*
(Сеть на хост) будет преобразовать входящие данные обратно (опять же, независимо от эндсианности платформы)
с верхней части моей головы...
const char* s; // the string you want to send
short len = strlen(s);
// allocate a buffer with enough room for the length info and the string
char* xfer = new char[ len + sizeof(short) ];
// copy the length info into the start of the buffer
// note: you need to hanle endian-ness of the short here.
memcpy(xfer, &len, sizeof(short));
// copy the string into the buffer
strncpy(xfer + sizeof(short), s, len);
// now xfer is the string you want to send across the wire.
// it starts with a short to identify its length.
// it is NOT null-terminated.