src/util/u_queue.c

b8e80941Smrg/*
b8e80941Smrg * Copyright © 2016 Advanced Micro Devices, Inc.
b8e80941Smrg * All Rights Reserved.
b8e80941Smrg *
b8e80941Smrg * Permission is hereby granted, free of charge, to any person obtaining
b8e80941Smrg * a copy of this software and associated documentation files (the
b8e80941Smrg * "Software"), to deal in the Software without restriction, including
b8e80941Smrg * without limitation the rights to use, copy, modify, merge, publish,
b8e80941Smrg * distribute, sub license, and/or sell copies of the Software, and to
b8e80941Smrg * permit persons to whom the Software is furnished to do so, subject to
b8e80941Smrg * the following conditions:
b8e80941Smrg *
b8e80941Smrg * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
b8e80941Smrg * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES
b8e80941Smrg * OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
b8e80941Smrg * NON-INFRINGEMENT. IN NO EVENT SHALL THE COPYRIGHT HOLDERS, AUTHORS
b8e80941Smrg * AND/OR ITS SUPPLIERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
b8e80941Smrg * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE,
b8e80941Smrg * ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE
b8e80941Smrg * USE OR OTHER DEALINGS IN THE SOFTWARE.
b8e80941Smrg *
b8e80941Smrg * The above copyright notice and this permission notice (including the
b8e80941Smrg * next paragraph) shall be included in all copies or substantial portions
b8e80941Smrg * of the Software.
b8e80941Smrg */
b8e80941Smrg
b8e80941Smrg#include "u_queue.h"
b8e80941Smrg
b8e80941Smrg#include <time.h>
b8e80941Smrg
b8e80941Smrg#include "util/os_time.h"
b8e80941Smrg#include "util/u_string.h"
b8e80941Smrg#include "util/u_thread.h"
b8e80941Smrg#include "u_process.h"
b8e80941Smrg
b8e80941Smrgstatic void
b8e80941Smrgutil_queue_kill_threads(struct util_queue *queue, unsigned keep_num_threads,
b8e80941Smrg                        bool finish_locked);
b8e80941Smrg
b8e80941Smrg/****************************************************************************
b8e80941Smrg * Wait for all queues to assert idle when exit() is called.
b8e80941Smrg *
b8e80941Smrg * Otherwise, C++ static variable destructors can be called while threads
b8e80941Smrg * are using the static variables.
b8e80941Smrg */
b8e80941Smrg
b8e80941Smrgstatic once_flag atexit_once_flag = ONCE_FLAG_INIT;
b8e80941Smrgstatic struct list_head queue_list;
b8e80941Smrgstatic mtx_t exit_mutex = _MTX_INITIALIZER_NP;
b8e80941Smrg
b8e80941Smrg#define HAVE_NOATEXIT
b8e80941Smrg#if defined(HAVE_NOATEXIT)
b8e80941Smrgstatic int global_init_called = 0;
b8e80941Smrg
b8e80941Smrgstatic void __attribute__((__destructor__))
b8e80941Smrg#else
b8e80941Smrgstatic void
b8e80941Smrg#endif
b8e80941Smrgatexit_handler(void)
b8e80941Smrg{
b8e80941Smrg   struct util_queue *iter;
b8e80941Smrg
b8e80941Smrg#if defined(HAVE_NOATEXIT)
b8e80941Smrg   if (!global_init_called)
b8e80941Smrg      return;
b8e80941Smrg#endif
b8e80941Smrg
b8e80941Smrg   mtx_lock(&exit_mutex);
b8e80941Smrg   /* Wait for all queues to assert idle. */
b8e80941Smrg   LIST_FOR_EACH_ENTRY(iter, &queue_list, head) {
b8e80941Smrg      util_queue_kill_threads(iter, 0, false);
b8e80941Smrg   }
b8e80941Smrg   mtx_unlock(&exit_mutex);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgstatic void
b8e80941Smrgglobal_init(void)
b8e80941Smrg{
b8e80941Smrg   LIST_INITHEAD(&queue_list);
b8e80941Smrg#if defined(HAVE_NOATEXIT)
b8e80941Smrg   global_init_called = 1;
b8e80941Smrg#else
b8e80941Smrg   atexit(atexit_handler);
b8e80941Smrg#endif
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgstatic void
b8e80941Smrgadd_to_atexit_list(struct util_queue *queue)
b8e80941Smrg{
b8e80941Smrg   call_once(&atexit_once_flag, global_init);
b8e80941Smrg
b8e80941Smrg   mtx_lock(&exit_mutex);
b8e80941Smrg   LIST_ADD(&queue->head, &queue_list);
b8e80941Smrg   mtx_unlock(&exit_mutex);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgstatic void
b8e80941Smrgremove_from_atexit_list(struct util_queue *queue)
b8e80941Smrg{
b8e80941Smrg   struct util_queue *iter, *tmp;
b8e80941Smrg
b8e80941Smrg   mtx_lock(&exit_mutex);
b8e80941Smrg   LIST_FOR_EACH_ENTRY_SAFE(iter, tmp, &queue_list, head) {
b8e80941Smrg      if (iter == queue) {
b8e80941Smrg         LIST_DEL(&iter->head);
b8e80941Smrg         break;
b8e80941Smrg      }
b8e80941Smrg   }
b8e80941Smrg   mtx_unlock(&exit_mutex);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg/****************************************************************************
b8e80941Smrg * util_queue_fence
b8e80941Smrg */
b8e80941Smrg
b8e80941Smrg#ifdef UTIL_QUEUE_FENCE_FUTEX
b8e80941Smrgstatic bool
b8e80941Smrgdo_futex_fence_wait(struct util_queue_fence *fence,
b8e80941Smrg                    bool timeout, int64_t abs_timeout)
b8e80941Smrg{
b8e80941Smrg   uint32_t v = fence->val;
b8e80941Smrg   struct timespec ts;
b8e80941Smrg   ts.tv_sec = abs_timeout / (1000*1000*1000);
b8e80941Smrg   ts.tv_nsec = abs_timeout % (1000*1000*1000);
b8e80941Smrg
b8e80941Smrg   while (v != 0) {
b8e80941Smrg      if (v != 2) {
b8e80941Smrg         v = p_atomic_cmpxchg(&fence->val, 1, 2);
b8e80941Smrg         if (v == 0)
b8e80941Smrg            return true;
b8e80941Smrg      }
b8e80941Smrg
b8e80941Smrg      int r = futex_wait(&fence->val, 2, timeout ? &ts : NULL);
b8e80941Smrg      if (timeout && r < 0) {
b8e80941Smrg         if (errno == ETIMEDOUT)
b8e80941Smrg            return false;
b8e80941Smrg      }
b8e80941Smrg
b8e80941Smrg      v = fence->val;
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   return true;
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgvoid
b8e80941Smrg_util_queue_fence_wait(struct util_queue_fence *fence)
b8e80941Smrg{
b8e80941Smrg   do_futex_fence_wait(fence, false, 0);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgbool
b8e80941Smrg_util_queue_fence_wait_timeout(struct util_queue_fence *fence,
b8e80941Smrg                               int64_t abs_timeout)
b8e80941Smrg{
b8e80941Smrg   return do_futex_fence_wait(fence, true, abs_timeout);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg#endif
b8e80941Smrg
b8e80941Smrg#ifdef UTIL_QUEUE_FENCE_STANDARD
b8e80941Smrgvoid
b8e80941Smrgutil_queue_fence_signal(struct util_queue_fence *fence)
b8e80941Smrg{
b8e80941Smrg   mtx_lock(&fence->mutex);
b8e80941Smrg   fence->signalled = true;
b8e80941Smrg   cnd_broadcast(&fence->cond);
b8e80941Smrg   mtx_unlock(&fence->mutex);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgvoid
b8e80941Smrg_util_queue_fence_wait(struct util_queue_fence *fence)
b8e80941Smrg{
b8e80941Smrg   mtx_lock(&fence->mutex);
b8e80941Smrg   while (!fence->signalled)
b8e80941Smrg      cnd_wait(&fence->cond, &fence->mutex);
b8e80941Smrg   mtx_unlock(&fence->mutex);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgbool
b8e80941Smrg_util_queue_fence_wait_timeout(struct util_queue_fence *fence,
b8e80941Smrg                               int64_t abs_timeout)
b8e80941Smrg{
b8e80941Smrg   /* This terrible hack is made necessary by the fact that we really want an
b8e80941Smrg    * internal interface consistent with os_time_*, but cnd_timedwait is spec'd
b8e80941Smrg    * to be relative to the TIME_UTC clock.
b8e80941Smrg    */
b8e80941Smrg   int64_t rel = abs_timeout - os_time_get_nano();
b8e80941Smrg
b8e80941Smrg   if (rel > 0) {
b8e80941Smrg      struct timespec ts;
b8e80941Smrg
b8e80941Smrg      timespec_get(&ts, TIME_UTC);
b8e80941Smrg
b8e80941Smrg      ts.tv_sec += abs_timeout / (1000*1000*1000);
b8e80941Smrg      ts.tv_nsec += abs_timeout % (1000*1000*1000);
b8e80941Smrg      if (ts.tv_nsec >= (1000*1000*1000)) {
b8e80941Smrg         ts.tv_sec++;
b8e80941Smrg         ts.tv_nsec -= (1000*1000*1000);
b8e80941Smrg      }
b8e80941Smrg
b8e80941Smrg      mtx_lock(&fence->mutex);
b8e80941Smrg      while (!fence->signalled) {
b8e80941Smrg         if (cnd_timedwait(&fence->cond, &fence->mutex, &ts) != thrd_success)
b8e80941Smrg            break;
b8e80941Smrg      }
b8e80941Smrg      mtx_unlock(&fence->mutex);
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   return fence->signalled;
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgvoid
b8e80941Smrgutil_queue_fence_init(struct util_queue_fence *fence)
b8e80941Smrg{
b8e80941Smrg   memset(fence, 0, sizeof(*fence));
b8e80941Smrg   (void) mtx_init(&fence->mutex, mtx_plain);
b8e80941Smrg   cnd_init(&fence->cond);
b8e80941Smrg   fence->signalled = true;
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgvoid
b8e80941Smrgutil_queue_fence_destroy(struct util_queue_fence *fence)
b8e80941Smrg{
b8e80941Smrg   assert(fence->signalled);
b8e80941Smrg
b8e80941Smrg   /* Ensure that another thread is not in the middle of
b8e80941Smrg    * util_queue_fence_signal (having set the fence to signalled but still
b8e80941Smrg    * holding the fence mutex).
b8e80941Smrg    *
b8e80941Smrg    * A common contract between threads is that as soon as a fence is signalled
b8e80941Smrg    * by thread A, thread B is allowed to destroy it. Since
b8e80941Smrg    * util_queue_fence_is_signalled does not lock the fence mutex (for
b8e80941Smrg    * performance reasons), we must do so here.
b8e80941Smrg    */
b8e80941Smrg   mtx_lock(&fence->mutex);
b8e80941Smrg   mtx_unlock(&fence->mutex);
b8e80941Smrg
b8e80941Smrg   cnd_destroy(&fence->cond);
b8e80941Smrg   mtx_destroy(&fence->mutex);
b8e80941Smrg}
b8e80941Smrg#endif
b8e80941Smrg
b8e80941Smrg/****************************************************************************
b8e80941Smrg * util_queue implementation
b8e80941Smrg */
b8e80941Smrg
b8e80941Smrgstruct thread_input {
b8e80941Smrg   struct util_queue *queue;
b8e80941Smrg   int thread_index;
b8e80941Smrg};
b8e80941Smrg
b8e80941Smrgstatic int
b8e80941Smrgutil_queue_thread_func(void *input)
b8e80941Smrg{
b8e80941Smrg   struct util_queue *queue = ((struct thread_input*)input)->queue;
b8e80941Smrg   int thread_index = ((struct thread_input*)input)->thread_index;
b8e80941Smrg
b8e80941Smrg   free(input);
b8e80941Smrg
b8e80941Smrg#ifdef HAVE_PTHREAD_SETAFFINITY
b8e80941Smrg   if (queue->flags & UTIL_QUEUE_INIT_SET_FULL_THREAD_AFFINITY) {
b8e80941Smrg      /* Don't inherit the thread affinity from the parent thread.
b8e80941Smrg       * Set the full mask.
b8e80941Smrg       */
b8e80941Smrg#if defined(__NetBSD__)
b8e80941Smrg      cpuset_t *cpuset;
b8e80941Smrg      cpuset = cpuset_create();
b8e80941Smrg      if (cpuset != NULL) {
b8e80941Smrg         cpuset_zero(cpuset);
b8e80941Smrg         for (unsigned i = 0; i < cpuset_size(cpuset); i++)
b8e80941Smrg            cpuset_set(i, cpuset);
b8e80941Smrg
b8e80941Smrg         pthread_setaffinity_np(pthread_self(), cpuset_size(cpuset), cpuset);
b8e80941Smrg         cpuset_destroy(cpuset);
b8e80941Smrg      }
b8e80941Smrg#else
b8e80941Smrg      cpu_set_t cpuset;
b8e80941Smrg      CPU_ZERO(&cpuset);
b8e80941Smrg      for (unsigned i = 0; i < CPU_SETSIZE; i++)
b8e80941Smrg         CPU_SET(i, &cpuset);
b8e80941Smrg
b8e80941Smrg      pthread_setaffinity_np(pthread_self(), sizeof(cpuset), &cpuset);
b8e80941Smrg#endif
b8e80941Smrg   }
b8e80941Smrg#endif
b8e80941Smrg
b8e80941Smrg   if (strlen(queue->name) > 0) {
b8e80941Smrg      char name[16];
b8e80941Smrg      util_snprintf(name, sizeof(name), "%s%i", queue->name, thread_index);
b8e80941Smrg      u_thread_setname(name);
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   while (1) {
b8e80941Smrg      struct util_queue_job job;
b8e80941Smrg
b8e80941Smrg      mtx_lock(&queue->lock);
b8e80941Smrg      assert(queue->num_queued >= 0 && queue->num_queued <= queue->max_jobs);
b8e80941Smrg
b8e80941Smrg      /* wait if the queue is empty */
b8e80941Smrg      while (thread_index < queue->num_threads && queue->num_queued == 0)
b8e80941Smrg         cnd_wait(&queue->has_queued_cond, &queue->lock);
b8e80941Smrg
b8e80941Smrg      /* only kill threads that are above "num_threads" */
b8e80941Smrg      if (thread_index >= queue->num_threads) {
b8e80941Smrg         mtx_unlock(&queue->lock);
b8e80941Smrg         break;
b8e80941Smrg      }
b8e80941Smrg
b8e80941Smrg      job = queue->jobs[queue->read_idx];
b8e80941Smrg      memset(&queue->jobs[queue->read_idx], 0, sizeof(struct util_queue_job));
b8e80941Smrg      queue->read_idx = (queue->read_idx + 1) % queue->max_jobs;
b8e80941Smrg
b8e80941Smrg      queue->num_queued--;
b8e80941Smrg      cnd_signal(&queue->has_space_cond);
b8e80941Smrg      mtx_unlock(&queue->lock);
b8e80941Smrg
b8e80941Smrg      if (job.job) {
b8e80941Smrg         job.execute(job.job, thread_index);
b8e80941Smrg         util_queue_fence_signal(job.fence);
b8e80941Smrg         if (job.cleanup)
b8e80941Smrg            job.cleanup(job.job, thread_index);
b8e80941Smrg      }
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   /* signal remaining jobs if all threads are being terminated */
b8e80941Smrg   mtx_lock(&queue->lock);
b8e80941Smrg   if (queue->num_threads == 0) {
b8e80941Smrg      for (unsigned i = queue->read_idx; i != queue->write_idx;
b8e80941Smrg           i = (i + 1) % queue->max_jobs) {
b8e80941Smrg         if (queue->jobs[i].job) {
b8e80941Smrg            util_queue_fence_signal(queue->jobs[i].fence);
b8e80941Smrg            queue->jobs[i].job = NULL;
b8e80941Smrg         }
b8e80941Smrg      }
b8e80941Smrg      queue->read_idx = queue->write_idx;
b8e80941Smrg      queue->num_queued = 0;
b8e80941Smrg   }
b8e80941Smrg   mtx_unlock(&queue->lock);
b8e80941Smrg   return 0;
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgstatic bool
b8e80941Smrgutil_queue_create_thread(struct util_queue *queue, unsigned index)
b8e80941Smrg{
b8e80941Smrg   struct thread_input *input =
b8e80941Smrg      (struct thread_input *) malloc(sizeof(struct thread_input));
b8e80941Smrg   input->queue = queue;
b8e80941Smrg   input->thread_index = index;
b8e80941Smrg
b8e80941Smrg   queue->threads[index] = u_thread_create(util_queue_thread_func, input);
b8e80941Smrg
b8e80941Smrg   if (!queue->threads[index]) {
b8e80941Smrg      free(input);
b8e80941Smrg      return false;
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   if (queue->flags & UTIL_QUEUE_INIT_USE_MINIMUM_PRIORITY) {
b8e80941Smrg#if defined(__linux__) && defined(SCHED_IDLE)
b8e80941Smrg      struct sched_param sched_param = {0};
b8e80941Smrg
b8e80941Smrg      /* The nice() function can only set a maximum of 19.
b8e80941Smrg       * SCHED_IDLE is the same as nice = 20.
b8e80941Smrg       *
b8e80941Smrg       * Note that Linux only allows decreasing the priority. The original
b8e80941Smrg       * priority can't be restored.
b8e80941Smrg       */
b8e80941Smrg      pthread_setschedparam(queue->threads[index], SCHED_IDLE, &sched_param);
b8e80941Smrg#endif
b8e80941Smrg   }
b8e80941Smrg   return true;
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgvoid
b8e80941Smrgutil_queue_adjust_num_threads(struct util_queue *queue, unsigned num_threads)
b8e80941Smrg{
b8e80941Smrg   num_threads = MIN2(num_threads, queue->max_threads);
b8e80941Smrg   num_threads = MAX2(num_threads, 1);
b8e80941Smrg
b8e80941Smrg   mtx_lock(&queue->finish_lock);
b8e80941Smrg   unsigned old_num_threads = queue->num_threads;
b8e80941Smrg
b8e80941Smrg   if (num_threads == old_num_threads) {
b8e80941Smrg      mtx_unlock(&queue->finish_lock);
b8e80941Smrg      return;
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   if (num_threads < old_num_threads) {
b8e80941Smrg      util_queue_kill_threads(queue, num_threads, true);
b8e80941Smrg      mtx_unlock(&queue->finish_lock);
b8e80941Smrg      return;
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   /* Create threads.
b8e80941Smrg    *
b8e80941Smrg    * We need to update num_threads first, because threads terminate
b8e80941Smrg    * when thread_index < num_threads.
b8e80941Smrg    */
b8e80941Smrg   queue->num_threads = num_threads;
b8e80941Smrg   for (unsigned i = old_num_threads; i < num_threads; i++) {
b8e80941Smrg      if (!util_queue_create_thread(queue, i))
b8e80941Smrg         break;
b8e80941Smrg   }
b8e80941Smrg   mtx_unlock(&queue->finish_lock);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgbool
b8e80941Smrgutil_queue_init(struct util_queue *queue,
b8e80941Smrg                const char *name,
b8e80941Smrg                unsigned max_jobs,
b8e80941Smrg                unsigned num_threads,
b8e80941Smrg                unsigned flags)
b8e80941Smrg{
b8e80941Smrg   unsigned i;
b8e80941Smrg
b8e80941Smrg   /* Form the thread name from process_name and name, limited to 13
b8e80941Smrg    * characters. Characters 14-15 are reserved for the thread number.
b8e80941Smrg    * Character 16 should be 0. Final form: "process:name12"
b8e80941Smrg    *
b8e80941Smrg    * If name is too long, it's truncated. If any space is left, the process
b8e80941Smrg    * name fills it.
b8e80941Smrg    */
b8e80941Smrg   const char *process_name = util_get_process_name();
b8e80941Smrg   int process_len = process_name ? strlen(process_name) : 0;
b8e80941Smrg   int name_len = strlen(name);
b8e80941Smrg   const int max_chars = sizeof(queue->name) - 1;
b8e80941Smrg
b8e80941Smrg   name_len = MIN2(name_len, max_chars);
b8e80941Smrg
b8e80941Smrg   /* See if there is any space left for the process name, reserve 1 for
b8e80941Smrg    * the colon. */
b8e80941Smrg   process_len = MIN2(process_len, max_chars - name_len - 1);
b8e80941Smrg   process_len = MAX2(process_len, 0);
b8e80941Smrg
b8e80941Smrg   memset(queue, 0, sizeof(*queue));
b8e80941Smrg
b8e80941Smrg   if (process_len) {
b8e80941Smrg      util_snprintf(queue->name, sizeof(queue->name), "%.*s:%s",
b8e80941Smrg                    process_len, process_name, name);
b8e80941Smrg   } else {
b8e80941Smrg      util_snprintf(queue->name, sizeof(queue->name), "%s", name);
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   queue->flags = flags;
b8e80941Smrg   queue->max_threads = num_threads;
b8e80941Smrg   queue->num_threads = num_threads;
b8e80941Smrg   queue->max_jobs = max_jobs;
b8e80941Smrg
b8e80941Smrg   queue->jobs = (struct util_queue_job*)
b8e80941Smrg                 calloc(max_jobs, sizeof(struct util_queue_job));
b8e80941Smrg   if (!queue->jobs)
b8e80941Smrg      goto fail;
b8e80941Smrg
b8e80941Smrg   (void) mtx_init(&queue->lock, mtx_plain);
b8e80941Smrg   (void) mtx_init(&queue->finish_lock, mtx_plain);
b8e80941Smrg
b8e80941Smrg   queue->num_queued = 0;
b8e80941Smrg   cnd_init(&queue->has_queued_cond);
b8e80941Smrg   cnd_init(&queue->has_space_cond);
b8e80941Smrg
b8e80941Smrg   queue->threads = (thrd_t*) calloc(num_threads, sizeof(thrd_t));
b8e80941Smrg   if (!queue->threads)
b8e80941Smrg      goto fail;
b8e80941Smrg
b8e80941Smrg   /* start threads */
b8e80941Smrg   for (i = 0; i < num_threads; i++) {
b8e80941Smrg      if (!util_queue_create_thread(queue, i)) {
b8e80941Smrg         if (i == 0) {
b8e80941Smrg            /* no threads created, fail */
b8e80941Smrg            goto fail;
b8e80941Smrg         } else {
b8e80941Smrg            /* at least one thread created, so use it */
b8e80941Smrg            queue->num_threads = i;
b8e80941Smrg            break;
b8e80941Smrg         }
b8e80941Smrg      }
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   add_to_atexit_list(queue);
b8e80941Smrg   return true;
b8e80941Smrg
b8e80941Smrgfail:
b8e80941Smrg   free(queue->threads);
b8e80941Smrg
b8e80941Smrg   if (queue->jobs) {
b8e80941Smrg      cnd_destroy(&queue->has_space_cond);
b8e80941Smrg      cnd_destroy(&queue->has_queued_cond);
b8e80941Smrg      mtx_destroy(&queue->lock);
b8e80941Smrg      free(queue->jobs);
b8e80941Smrg   }
b8e80941Smrg   /* also util_queue_is_initialized can be used to check for success */
b8e80941Smrg   memset(queue, 0, sizeof(*queue));
b8e80941Smrg   return false;
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgstatic void
b8e80941Smrgutil_queue_kill_threads(struct util_queue *queue, unsigned keep_num_threads,
b8e80941Smrg                        bool finish_locked)
b8e80941Smrg{
b8e80941Smrg   unsigned i;
b8e80941Smrg
b8e80941Smrg   /* Signal all threads to terminate. */
b8e80941Smrg   if (!finish_locked)
b8e80941Smrg      mtx_lock(&queue->finish_lock);
b8e80941Smrg
b8e80941Smrg   if (keep_num_threads >= queue->num_threads) {
b8e80941Smrg      mtx_unlock(&queue->finish_lock);
b8e80941Smrg      return;
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   mtx_lock(&queue->lock);
b8e80941Smrg   unsigned old_num_threads = queue->num_threads;
b8e80941Smrg   /* Setting num_threads is what causes the threads to terminate.
b8e80941Smrg    * Then cnd_broadcast wakes them up and they will exit their function.
b8e80941Smrg    */
b8e80941Smrg   queue->num_threads = keep_num_threads;
b8e80941Smrg   cnd_broadcast(&queue->has_queued_cond);
b8e80941Smrg   mtx_unlock(&queue->lock);
b8e80941Smrg
b8e80941Smrg   for (i = keep_num_threads; i < old_num_threads; i++)
b8e80941Smrg      thrd_join(queue->threads[i], NULL);
b8e80941Smrg
b8e80941Smrg   if (!finish_locked)
b8e80941Smrg      mtx_unlock(&queue->finish_lock);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgvoid
b8e80941Smrgutil_queue_destroy(struct util_queue *queue)
b8e80941Smrg{
b8e80941Smrg   util_queue_kill_threads(queue, 0, false);
b8e80941Smrg   remove_from_atexit_list(queue);
b8e80941Smrg
b8e80941Smrg   cnd_destroy(&queue->has_space_cond);
b8e80941Smrg   cnd_destroy(&queue->has_queued_cond);
b8e80941Smrg   mtx_destroy(&queue->finish_lock);
b8e80941Smrg   mtx_destroy(&queue->lock);
b8e80941Smrg   free(queue->jobs);
b8e80941Smrg   free(queue->threads);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgvoid
b8e80941Smrgutil_queue_add_job(struct util_queue *queue,
b8e80941Smrg                   void *job,
b8e80941Smrg                   struct util_queue_fence *fence,
b8e80941Smrg                   util_queue_execute_func execute,
b8e80941Smrg                   util_queue_execute_func cleanup)
b8e80941Smrg{
b8e80941Smrg   struct util_queue_job *ptr;
b8e80941Smrg
b8e80941Smrg   mtx_lock(&queue->lock);
b8e80941Smrg   if (queue->num_threads == 0) {
b8e80941Smrg      mtx_unlock(&queue->lock);
b8e80941Smrg      /* well no good option here, but any leaks will be
b8e80941Smrg       * short-lived as things are shutting down..
b8e80941Smrg       */
b8e80941Smrg      return;
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   util_queue_fence_reset(fence);
b8e80941Smrg
b8e80941Smrg   assert(queue->num_queued >= 0 && queue->num_queued <= queue->max_jobs);
b8e80941Smrg
b8e80941Smrg   if (queue->num_queued == queue->max_jobs) {
b8e80941Smrg      if (queue->flags & UTIL_QUEUE_INIT_RESIZE_IF_FULL) {
b8e80941Smrg         /* If the queue is full, make it larger to avoid waiting for a free
b8e80941Smrg          * slot.
b8e80941Smrg          */
b8e80941Smrg         unsigned new_max_jobs = queue->max_jobs + 8;
b8e80941Smrg         struct util_queue_job *jobs =
b8e80941Smrg            (struct util_queue_job*)calloc(new_max_jobs,
b8e80941Smrg                                           sizeof(struct util_queue_job));
b8e80941Smrg         assert(jobs);
b8e80941Smrg
b8e80941Smrg         /* Copy all queued jobs into the new list. */
b8e80941Smrg         unsigned num_jobs = 0;
b8e80941Smrg         unsigned i = queue->read_idx;
b8e80941Smrg
b8e80941Smrg         do {
b8e80941Smrg            jobs[num_jobs++] = queue->jobs[i];
b8e80941Smrg            i = (i + 1) % queue->max_jobs;
b8e80941Smrg         } while (i != queue->write_idx);
b8e80941Smrg
b8e80941Smrg         assert(num_jobs == queue->num_queued);
b8e80941Smrg
b8e80941Smrg         free(queue->jobs);
b8e80941Smrg         queue->jobs = jobs;
b8e80941Smrg         queue->read_idx = 0;
b8e80941Smrg         queue->write_idx = num_jobs;
b8e80941Smrg         queue->max_jobs = new_max_jobs;
b8e80941Smrg      } else {
b8e80941Smrg         /* Wait until there is a free slot. */
b8e80941Smrg         while (queue->num_queued == queue->max_jobs)
b8e80941Smrg            cnd_wait(&queue->has_space_cond, &queue->lock);
b8e80941Smrg      }
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   ptr = &queue->jobs[queue->write_idx];
b8e80941Smrg   assert(ptr->job == NULL);
b8e80941Smrg   ptr->job = job;
b8e80941Smrg   ptr->fence = fence;
b8e80941Smrg   ptr->execute = execute;
b8e80941Smrg   ptr->cleanup = cleanup;
b8e80941Smrg   queue->write_idx = (queue->write_idx + 1) % queue->max_jobs;
b8e80941Smrg
b8e80941Smrg   queue->num_queued++;
b8e80941Smrg   cnd_signal(&queue->has_queued_cond);
b8e80941Smrg   mtx_unlock(&queue->lock);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg/**
b8e80941Smrg * Remove a queued job. If the job hasn't started execution, it's removed from
b8e80941Smrg * the queue. If the job has started execution, the function waits for it to
b8e80941Smrg * complete.
b8e80941Smrg *
b8e80941Smrg * In all cases, the fence is signalled when the function returns.
b8e80941Smrg *
b8e80941Smrg * The function can be used when destroying an object associated with the job
b8e80941Smrg * when you don't care about the job completion state.
b8e80941Smrg */
b8e80941Smrgvoid
b8e80941Smrgutil_queue_drop_job(struct util_queue *queue, struct util_queue_fence *fence)
b8e80941Smrg{
b8e80941Smrg   bool removed = false;
b8e80941Smrg
b8e80941Smrg   if (util_queue_fence_is_signalled(fence))
b8e80941Smrg      return;
b8e80941Smrg
b8e80941Smrg   mtx_lock(&queue->lock);
b8e80941Smrg   for (unsigned i = queue->read_idx; i != queue->write_idx;
b8e80941Smrg        i = (i + 1) % queue->max_jobs) {
b8e80941Smrg      if (queue->jobs[i].fence == fence) {
b8e80941Smrg         if (queue->jobs[i].cleanup)
b8e80941Smrg            queue->jobs[i].cleanup(queue->jobs[i].job, -1);
b8e80941Smrg
b8e80941Smrg         /* Just clear it. The threads will treat as a no-op job. */
b8e80941Smrg         memset(&queue->jobs[i], 0, sizeof(queue->jobs[i]));
b8e80941Smrg         removed = true;
b8e80941Smrg         break;
b8e80941Smrg      }
b8e80941Smrg   }
b8e80941Smrg   mtx_unlock(&queue->lock);
b8e80941Smrg
b8e80941Smrg   if (removed)
b8e80941Smrg      util_queue_fence_signal(fence);
b8e80941Smrg   else
b8e80941Smrg      util_queue_fence_wait(fence);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgstatic void
b8e80941Smrgutil_queue_finish_execute(void *data, int num_thread)
b8e80941Smrg{
b8e80941Smrg   util_barrier *barrier = data;
b8e80941Smrg   util_barrier_wait(barrier);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrg/**
b8e80941Smrg * Wait until all previously added jobs have completed.
b8e80941Smrg */
b8e80941Smrgvoid
b8e80941Smrgutil_queue_finish(struct util_queue *queue)
b8e80941Smrg{
b8e80941Smrg   util_barrier barrier;
b8e80941Smrg   struct util_queue_fence *fences;
b8e80941Smrg
b8e80941Smrg   /* If 2 threads were adding jobs for 2 different barries at the same time,
b8e80941Smrg    * a deadlock would happen, because 1 barrier requires that all threads
b8e80941Smrg    * wait for it exclusively.
b8e80941Smrg    */
b8e80941Smrg   mtx_lock(&queue->finish_lock);
b8e80941Smrg   fences = malloc(queue->num_threads * sizeof(*fences));
b8e80941Smrg   util_barrier_init(&barrier, queue->num_threads);
b8e80941Smrg
b8e80941Smrg   for (unsigned i = 0; i < queue->num_threads; ++i) {
b8e80941Smrg      util_queue_fence_init(&fences[i]);
b8e80941Smrg      util_queue_add_job(queue, &barrier, &fences[i], util_queue_finish_execute, NULL);
b8e80941Smrg   }
b8e80941Smrg
b8e80941Smrg   for (unsigned i = 0; i < queue->num_threads; ++i) {
b8e80941Smrg      util_queue_fence_wait(&fences[i]);
b8e80941Smrg      util_queue_fence_destroy(&fences[i]);
b8e80941Smrg   }
b8e80941Smrg   mtx_unlock(&queue->finish_lock);
b8e80941Smrg
b8e80941Smrg   util_barrier_destroy(&barrier);
b8e80941Smrg
b8e80941Smrg   free(fences);
b8e80941Smrg}
b8e80941Smrg
b8e80941Smrgint64_t
b8e80941Smrgutil_queue_get_thread_time_nano(struct util_queue *queue, unsigned thread_index)
b8e80941Smrg{
b8e80941Smrg   /* Allow some flexibility by not raising an error. */
b8e80941Smrg   if (thread_index >= queue->num_threads)
b8e80941Smrg      return 0;
b8e80941Smrg
b8e80941Smrg   return u_thread_get_time_nano(queue->threads[thread_index]);
b8e80941Smrg}