トップ 新規 編集 差分 一覧 Farm ソース 検索 ヘルプ PDF RSS ログイン

ソースコードハイライト機能のテスト

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
int main()
{
// -*- C++ -*-

#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include <math.h>

#include <cutil.h>

// サンプルの真似をしてGPUの計算を一応別ファイル化
#include "gpukernel.cu"

void
runTest(int argc, char** argv)
{
  CUT_DEVICE_INIT();

  int count;    
  cudaGetDeviceCount(&count);
  printf("count = %d\n", count);

  int nSize = 10;
  int n;
  n = sizeof(float)*nSize;

  // CPU側のデータを準備
  float *h_sd1;
  h_sd1 = (float*)malloc(n);
  int i;
  for(i=0; i<nSize; i++){
    h_sd1[i] = (float)(rand()%100)/10.0f;
  }
  // 値の確認
  for(i=0; i<nSize; i++){
    printf(" %f", h_sd1[i]);
  }
  printf("\n");

  // GPU側のメモリを準備
  float* d_sd1;
  CUDA_SAFE_CALL(cudaMalloc((void**)&d_sd1, n));
  CUDA_SAFE_CALL(cudaMemcpy(d_sd1, h_sd1, n, cudaMemcpyHostToDevice) );
  
  // 演算結果取得のためのメモリを準備
  float *h_sd2;
  h_sd2 = (float*)malloc(n);
  float* d_sd2;
  CUDA_SAFE_CALL(cudaMalloc((void**)&d_sd2, n));
  
  // 実行のためのパラメタを準備
  dim3 threads(nSize, 1, 1);
  dim3 grid(1,1,1);

  // 実行
  test<<< grid, threads >>>(d_sd2, d_sd1, nSize, 2.0f);

  // GPUの処理に問題が起きていないかの確認  
  CUT_CHECK_ERROR("Kernel execution failed");

  // 演算結果の取得
  CUDA_SAFE_CALL(cudaMemcpy(h_sd2, d_sd2, n, cudaMemcpyDeviceToHost) );

  // 演算結果の確認
  for(i=0; i<nSize; i++){
    printf(" %f", h_sd2[i]);
  }
  printf("\n");

  // クリーンアップ
  free(h_sd1);
  free(h_sd2);
  CUDA_SAFE_CALL(cudaFree(d_sd1));
  CUDA_SAFE_CALL(cudaFree(d_sd2));
}


int
main(int argc, char** argv)
{
  runTest(argc, argv);
  
  CUT_EXIT(argc, argv);
}
}

最終更新時間:2008年01月25日 14時56分18秒