llama cpp cuda_docker_arch