Использование yyparse() для создания двухпроходного ассемблера?
-
23-08-2019 - |
Вопрос
Я пишу ассемблер для собственного микроконтроллера, над которым работаю.Я довел ассемблер до такой степени, что он будет собирать инструкции в двоичный код.
Однако сейчас у меня проблемы с тем, чтобы ярлыки работали.В настоящее время, когда мой ассемблер встречает новую метку, он сохраняет имя метки и ячейку памяти, на которую она ссылается.Когда инструкция ссылается на метку, ассемблер ищет метку и заменяет ее соответствующим значением.
Это прекрасно, но что, если метка определена после ссылающейся на нее инструкции?Из-за этого мне нужно, чтобы мой парсер дважды прогонял код.
Вот что у меня сейчас есть для моей основной функции:
303 int main(int argc, char* argv[])
304 {
305
306 if(argc < 1 || strcmp(argv[1],"-h")==0 || 0==strcmp(argv[1],"--help"))
307 {
308 //printf("%s\n", usage);
309 return 1;
310 }
311 // redirect stdin to the file pointer
312 int stdin = dup(0);
313 close(0);
314
315 // pass 1 on the file
316 int fp = open(argv[1], O_RDONLY, "r");
317 dup2(fp, 0);
318
319 yyparse();
320
321 lseek(fp, SEEK_SET, 0);
322
323 // pass 2 on the file
324 if(secondPassNeeded)
325 {
326 fp = open(argv[1], O_RDONLY, "r");
327 dup2(fp, 0);
328 yyparse();
329 }
330 close(fp);
331
332 // restore stdin
333 dup2(0, stdin);
334
335 for(int i = 0; i < labels.size(); i++)
336 {
337 printf("Label: %s, Loc: %d\n", labels[i].name.c_str(), labels[i].memoryLoc);
338 }
339 return 0;
340 }
Я использую это внутри конфигурации flex/bison.
Решение
Если это все, что вам нужно, вам не нужен полноценный двухпроходный ассемблер.Если метка не определена при ссылке на нее, вы просто выводите дублирующий адрес (скажем, 0x0000) и получаете структуру данных, в которой перечислены все места с прямыми ссылками и символ, на который они ссылаются.В конце файла (или блока, если у вас есть локальные символы) вы просто просматриваете этот список и исправляете адреса.