El puntero booleano estático global causa falla de segmentación con PTHread
-
24-10-2019 - |
Pregunta
Nuevo en la programación PTHREAD, y se quedó con este error cuando se trabaja en un código mixto C ++ & C.
Lo que he hecho es llamar al código C en el hilo creado por el código C ++. Hay un puntero booleano estático is_center
Usado en el hilo y debe liberarse cuando termine el hilo.
Sin embargo, noté que cada vez que el programa se procesó en la función C, el valor del puntero booleano se cambiaría y la falla de segmentación ocurrió debido al libre (). Y el problema solo ocurre cuando se usa el código C. Elimine el código C y la parte C ++ múltiple funciona bien.
El código de detalle es el siguiente:
static bool *is_center;
// omit other codes in between ...
void streamCluster( PStream* stream)
{
// some code here ...
while(1){
// some code here ...
is_center = (bool*)calloc(points.num,sizeof(bool));
// start the parallel thread here.
// the c code is invoked in this function.
localSearch(&points,kmin, kmax,&kfinal); // parallel
free(is_center);
}
Y la función que usa paralelo es la siguiente (mi código C se invoca en cada hilo):
void localSearch( Points* points, long kmin, long kmax, long* kfinal ) {
pthread_barrier_t barrier;
pthread_t* threads = new pthread_t[nproc];
pkmedian_arg_t* arg = new pkmedian_arg_t[nproc];
pthread_barrier_init(&barrier,NULL,nproc);
for( int i = 0; i < nproc; i++ ) {
arg[i].points = points;
arg[i].kmin = kmin;
arg[i].kmax = kmax;
arg[i].pid = i;
arg[i].kfinal = kfinal;
arg[i].barrier = &barrier;
pthread_create(threads+i,NULL,localSearchSub,(void*)&arg[i]);
}
for ( int i = 0; i < nproc; i++) {
pthread_join(threads[i],NULL);
}
delete[] threads;
delete[] arg;
pthread_barrier_destroy(&barrier);
}
Finalmente la función que llama a mi código C:
void* localSearchSub(void* arg_) {
int eventSet = PAPI_NULL;
begin_papi_thread(&eventSet);
pkmedian_arg_t* arg= (pkmedian_arg_t*)arg_;
pkmedian(arg->points,arg->kmin,arg->kmax,arg->kfinal,arg->pid,arg->barrier);
end_papi_thread(&eventSet);
return NULL;
}
Y de GDB, lo que tengo por el is_center
es:
Breakpoint 2, localSearchSub (arg_=0x600000000000bc40) at streamcluster.cpp:1711
1711 end_papi_thread(&eventSet);
(gdb) s
Hardware watchpoint 1: is_center
Old value = (bool *) 0x600000000000bba0
New value = (bool *) 0xa93f3
0x400000000000d8d1 in localSearchSub (arg_=0x600000000000bc40) at streamcluster.cpp:1711
1711 end_papi_thread(&eventSet);
¿Alguna sugerencia? ¡Gracias por adelantado!
Alguna información nueva sobre el código: para el código C, estoy usando el paquete PAPI. Escribo mi propio envoltorio PAPI para inicializar y leer contadores del sistema. El código es el siguiente:
void begin_papi_thread(int* eventSet)
{
int thread_id = pthread_self();
// Events
if (PAPI_create_eventset(eventSet)) {
PAPI_perror(return_value, error_string, PAPI_MAX_STR_LEN);
printf("*** ERROR *** Failed to create event set for thread %d: %s\n.", thread_id, error_string);
}
if((return_value = PAPI_add_events(*eventSet, event_code, event_num)) != PAPI_OK)
{
printf("*** ERROR *** Failed to add event for thread %d: %d.\n", thread_id, return_value);
}
// Start counting
if ((return_value = PAPI_start(*eventSet)) != PAPI_OK) {
PAPI_perror(return_value, error_string, PAPI_MAX_STR_LEN);
printf("*** ERROR *** PAPI failed to start the event for thread %d: %s.\n", thread_id, error_string);
}
}
void end_papi_thread(int* eventSet)
{
int thread_id = pthread_self();
int i;
long long * count_values = (long long*)malloc(sizeof(long long) * event_num);
if (PAPI_read(*eventSet, count_values) != PAPI_OK)
printf("*** ERROR *** Failed to load count values.\n");
if (PAPI_stop(*eventSet, &dummy_values) != PAPI_OK) {
PAPI_perror(return_value, error_string, PAPI_MAX_STR_LEN);
printf("*** ERROR *** PAPI failed to stop the event for thread %d: %s.\n", thread_id, error_string);
return;
}
if(PAPI_cleanup_eventset(*eventSet) != PAPI_OK)
printf("*** ERROR *** Clean up failed for the thread %d.\n", thread_id);
}
Solución
No creo que hayas publicado suficiente código para entender realmente tu problema, pero parece sospechoso que hayas declarado is_center
global. Supongo que lo está usando en más de un lugar, posiblemente por múltiples hilos (localSearchSub
lo menciona, que es su función de hilo de trabajador).
Si is_center
está siendo leído o escrito por múltiples hilos, probablemente desee protegerlo con un pthread mutex. Dices que está "liberado cuando termina el hilo", pero debes tener en cuenta que hay nprocs
hilos, y parece que todos están trabajando en una variedad de is_center[points]
bools. Si points != nproc
, esto podría ser malo [1]. Cada hilo probablemente debería funcionar en su propia matriz, y localSearch
Debería agregar los resultados.
los xxx_papi_thread
Las funciones no obtienen ningún éxito en Google, por lo que solo puedo imaginar que es tuya ... es poco probable que podamos ayudarlo, si el problema está ahí :)
1]: incluso si points == nproc
, no es necesariamente bien escribir en diferentes elementos de una matriz de múltiples hilos (depende de su compilador y procesador). Esté seguro, use un mutex.
Además, esto está etiquetado C++
. ¿Puedes reemplazar el calloc
y matrices dinámicas (usando new
) con vector
¿s? Puede terminar más fácil de depurar, y ciertamente termina más fácil de mantener. ¿Por qué odias y quieres castigar a los lectores de tu código? ;)