一畳のくつろぎタイム

このブログでは紹介する商品画像をAmazonアソシエイトより借りています。画像やリンクにはアフィリエイト広告が含まれる事があります

2022年6月24日金曜日

Oracle Cloud(OCI)に手を出してみる


 Oracle cloud infrastructure(OCI)のAlways Freeがすごいという話は聞いていましたが、なかなか試せていませんでした。

やっぱ1台インターネット上に好きにできるマシンがあると便利だと考え、手を伸ばしてみたところ、0円の金にならないユーザーへの厚遇っぷりに驚きました。

何がすごいかというと、

AWSは1年という期限付きで、スペックがほどほどのコンピューターを1台借りれます。負荷が多くバースト機能が働かない場合は雑魚になります。

T型インスタンスのバーストについては以前書きました。


GCPは1台だけならずっとコンピューターを借りれますがスペックが雑魚です。

OCIは3台までずっとコンピューターが借りれます。GCPよりは多少スペックがよいです。なかなか作成できませんが、作れるとARM4コア24ギガメモリのコンピューターも借りれます。(本当は4台ですがグローバルIP付与できるのは3台らしい)

OCIのARMコアが1OCPU分だけ確保できたので性能を評価しました。

 

UnixBenchは5.1.3です。

まず比較対象としてRaspberry Pi4のUnixBenchです。

RaspberryPI4

 

Raspberry Pi4 ModelB

Amazonは高いのでKSYさんで買いましょう。


マルチコア4つで743 シングルコアだと262

========================================================================
   BYTE UNIX Benchmarks (Version 5.1.3)

   System: raspberrypi: GNU/Linux
   OS: GNU/Linux -- 5.10.17-v7l+ -- #1421 SMP Thu May 27 14:00:13 BST 2021
   Machine: armv7l (unknown)
   Language: en_US.utf8 (charmap="UTF-8", collate="UTF-8")
   CPU 0: ARMv7 Processor rev 3 (v7l) (0.0 bogomips)
          
   CPU 1: ARMv7 Processor rev 3 (v7l) (0.0 bogomips)
          
   CPU 2: ARMv7 Processor rev 3 (v7l) (0.0 bogomips)
          
   CPU 3: ARMv7 Processor rev 3 (v7l) (0.0 bogomips)
          
   13:30:29 up 52 days, 18:54,  3 users,  load average: 0.37, 0.13, 0.04; runlevel 5
------------------------------------------------------------------------
Benchmark Run: 火  8月 31 2021 13:58:22 - 14:26:20
4 CPUs in system; running 4 parallel copies of tests

Dhrystone 2 using register variables       40647233.2 lps   (10.0 s, 7 samples)
Double-Precision Whetstone                     9576.7 MWIPS (9.7 s, 7 samples)
Execl Throughput                               2435.7 lps   (29.9 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks        172441.8 KBps  (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks           47333.6 KBps  (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks        550941.8 KBps  (30.0 s, 2 samples)
Pipe Throughput                              400297.7 lps   (10.0 s, 7 samples)
Pipe-based Context Switching                 116248.7 lps   (10.0 s, 7 samples)
Process Creation                               4999.2 lps   (30.0 s, 2 samples)
Shell Scripts (1 concurrent)                   5460.8 lpm   (60.0 s, 2 samples)
Shell Scripts (8 concurrent)                    724.1 lpm   (60.2 s, 2 samples)
System Call Overhead                        1815522.4 lps   (10.0 s, 7 samples)

System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables         116700.0   40647233.2   3483.1
Double-Precision Whetstone                       55.0       9576.7   1741.2
Execl Throughput                                 43.0       2435.7    566.4
File Copy 1024 bufsize 2000 maxblocks          3960.0     172441.8    435.5
File Copy 256 bufsize 500 maxblocks            1655.0      47333.6    286.0
File Copy 4096 bufsize 8000 maxblocks          5800.0     550941.8    949.9
Pipe Throughput                               12440.0     400297.7    321.8
Pipe-based Context Switching                   4000.0     116248.7    290.6
Process Creation                                126.0       4999.2    396.8
Shell Scripts (1 concurrent)                     42.4       5460.8   1287.9
Shell Scripts (8 concurrent)                      6.0        724.1   1206.8
System Call Overhead                          15000.0    1815522.4   1210.3
                                                                   ========
System Benchmarks Index Score                                         743.1

 VM.Standard.E2.1.Micro

オラクルクラウドの無料枠で借りれるx86アーキテクチャのCPUの仮想マシンです。

EPYC7551プロセッサの1コアのうち2割程度が使えます。(0.2分のhyper-threadingもあり)

 

AMD PS755PBDVIHAF EPYC 7551P 32コア 2 GHz プロセッサー

スコア 539

========================================================================
   BYTE UNIX Benchmarks (Version 5.1.3)

   System: instance-11111111: GNU/Linux
   OS: GNU/Linux -- 5.4.17-2102.202.5.el7uek.x86_64 -- #2 SMP Sat May 22 16:17:06 PDT 2021
   Machine: x86_64 (x86_64)
   Language: en_US.utf8 (charmap="UTF-8", collate="UTF-8")
   CPU 0: AMD EPYC 7551 32-Core Processor (3992.5 bogomips)
          Hyper-Threading, x86-64, MMX, AMD MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET
   CPU 1: AMD EPYC 7551 32-Core Processor (3992.5 bogomips)
          Hyper-Threading, x86-64, MMX, AMD MMX, Physical Address Ext, SYSENTER/SYSEXIT, SYSCALL/SYSRET
   13:09:11 up 33 days, 18:33,  1 user,  load average: 0.01, 0.04, 0.00; runlevel 3
------------------------------------------------------------------------
Benchmark Run: 火  8月 31 2021 13:39:24 - 14:13:47
2 CPUs in system; running 2 parallel copies of tests

Dhrystone 2 using register variables       14527958.6 lps   (10.0 s, 7 samples)
Double-Precision Whetstone                     8149.1 MWIPS (9.7 s, 7 samples)
Execl Throughput                               1546.0 lps   (30.0 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks        269600.4 KBps  (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks           74290.0 KBps  (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks        662851.2 KBps  (30.0 s, 2 samples)
Pipe Throughput                              495291.8 lps   (10.0 s, 7 samples)
Pipe-based Context Switching                  73100.5 lps   (10.0 s, 7 samples)
Process Creation                               4197.4 lps   (30.1 s, 2 samples)
Shell Scripts (1 concurrent)                   2103.4 lpm   (60.1 s, 2 samples)
Shell Scripts (8 concurrent)                    304.2 lpm   (60.2 s, 2 samples)
System Call Overhead                         638899.8 lps   (10.0 s, 7 samples)

System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables         116700.0   14527958.6   1244.9
Double-Precision Whetstone                       55.0       8149.1   1481.6
Execl Throughput                                 43.0       1546.0    359.5
File Copy 1024 bufsize 2000 maxblocks          3960.0     269600.4    680.8
File Copy 256 bufsize 500 maxblocks            1655.0      74290.0    448.9
File Copy 4096 bufsize 8000 maxblocks          5800.0     662851.2   1142.8
Pipe Throughput                               12440.0     495291.8    398.1
Pipe-based Context Switching                   4000.0      73100.5    182.8
Process Creation                                126.0       4197.4    333.1
Shell Scripts (1 concurrent)                     42.4       2103.4    496.1
Shell Scripts (8 concurrent)                      6.0        304.2    506.9
System Call Overhead                          15000.0     638899.8    425.9
                                                                   ========
System Benchmarks Index Score                                         539.0


VM.Standard.A1.Flex

ARMアーキテクチャのAmpere Altraプロセッサーのインスタンスです。以前は1コアしか確保できませんでしたが、4コア確保できれば3.5倍程度の性能になると思われます。

1592

========================================================================
   BYTE UNIX Benchmarks (Version 5.1.3)

   System: instance-20210806-1451: GNU/Linux
   OS: GNU/Linux -- 5.4.17-2102.203.6.el7uek.aarch64 -- #2 SMP Wed Jul 21 17:55:00 PDT 2021
   Machine: aarch64 (aarch64)
   Language: en_US.utf8 (charmap="UTF-8", collate="UTF-8")
   04:12:41 up 24 days, 22:17,  1 user,  load average: 0.07, 0.02, 0.00; runlevel 3

------------------------------------------------------------------------
Benchmark Run: Tue Aug 31 2021 04:12:41 - 04:43:53
0 CPUs in system; running 1 parallel copy of tests

Dhrystone 2 using register variables       42126964.5 lps   (10.0 s, 7 samples)
Double-Precision Whetstone                     2268.4 MWIPS (29.1 s, 7 samples)
Execl Throughput                               5961.0 lps   (30.0 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks       1080446.5 KBps  (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks          293813.0 KBps  (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks       3281014.3 KBps  (30.0 s, 2 samples)
Pipe Throughput                             1700790.3 lps   (10.0 s, 7 samples)
Pipe-based Context Switching                 312467.2 lps   (10.0 s, 7 samples)
Process Creation                              12881.3 lps   (30.0 s, 2 samples)
Shell Scripts (1 concurrent)                   7196.6 lpm   (60.0 s, 2 samples)
Shell Scripts (8 concurrent)                   1017.6 lpm   (60.0 s, 2 samples)
System Call Overhead                        2252623.9 lps   (10.0 s, 7 samples)

System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables         116700.0   42126964.5   3609.9
Double-Precision Whetstone                       55.0       2268.4    412.4
Execl Throughput                                 43.0       5961.0   1386.3
File Copy 1024 bufsize 2000 maxblocks          3960.0    1080446.5   2728.4
File Copy 256 bufsize 500 maxblocks            1655.0     293813.0   1775.3
File Copy 4096 bufsize 8000 maxblocks          5800.0    3281014.3   5656.9
Pipe Throughput                               12440.0    1700790.3   1367.2
Pipe-based Context Switching                   4000.0     312467.2    781.2
Process Creation                                126.0      12881.3   1022.3
Shell Scripts (1 concurrent)                     42.4       7196.6   1697.3
Shell Scripts (8 concurrent)                      6.0       1017.6   1696.0
System Call Overhead                          15000.0    2252623.9   1501.7
                                                                   ========
System Benchmarks Index Score                                        1592.9


追記

 めげずに Ampere複数コアインスタンス作れるようになってないか確認していたら本日2022/6/23に+3コアと+18Gのメモリを取得できました。
 3636というスコアでした。
以前適当に考えて3.5倍になるような事を書きましたが、2.25倍でしたが、それでもすごいです。
手持ちスコアに近い数値の参考がないのですが、Core i3 2100(2Core4Thread)を搭載した実機が1700でしたのではるかに性能が良いです。
 
Webで調べてみると、Core i5-2405S(4Core4Thread)でのスコアが3800ぐらいで近く、Core i5ぐらいの性能が出てそうです。armコアはintelコアよりも構築作業で問題に引っかかることが多いですが、これが無料ってオラクルって会社すごいなぁ。

VM.Standard.A1.Flex 4コア

3636

Benchmark Run: Thu Jun 23 2022 11:42:21 - 12:13:36
4 CPUs in system; running 4 parallel copies of tests

Dhrystone 2 using register variables      176212467.3 lps   (10.0 s, 7 samples)
Double-Precision Whetstone                     9004.8 MWIPS (29.5 s, 7 samples)
Execl Throughput                              17454.6 lps   (30.0 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks       1022667.4 KBps  (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks          255084.5 KBps  (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks       3167185.2 KBps  (30.0 s, 2 samples)
Pipe Throughput                             6823472.4 lps   (10.0 s, 7 samples)
Pipe-based Context Switching                 984433.2 lps   (10.0 s, 7 samples)
Process Creation                              25895.5 lps   (30.0 s, 2 samples)
Shell Scripts (1 concurrent)                  20888.1 lpm   (60.0 s, 2 samples)
Shell Scripts (8 concurrent)                   3239.2 lpm   (60.1 s, 2 samples)
System Call Overhead                        4978405.7 lps   (10.0 s, 7 samples)

System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables         116700.0  176212467.3  15099.6
Double-Precision Whetstone                       55.0       9004.8   1637.2
Execl Throughput                                 43.0      17454.6   4059.2
File Copy 1024 bufsize 2000 maxblocks          3960.0    1022667.4   2582.5
File Copy 256 bufsize 500 maxblocks            1655.0     255084.5   1541.3
File Copy 4096 bufsize 8000 maxblocks          5800.0    3167185.2   5460.7
Pipe Throughput                               12440.0    6823472.4   5485.1
Pipe-based Context Switching                   4000.0     984433.2   2461.1
Process Creation                                126.0      25895.5   2055.2
Shell Scripts (1 concurrent)                     42.4      20888.1   4926.4
Shell Scripts (8 concurrent)                      6.0       3239.2   5398.7
System Call Overhead                          15000.0    4978405.7   3318.9
                                                                   ========
System Benchmarks Index Score                                        3636.1

シングルコアは1つ上のと同じなので、省略。

 

sysbenchだと

$ sysbench --test=cpu run  --num-threads=4

CPU speed:
    events per second: 13441.16


結果

CPUがARMなので多少の制約はあるが、UnixBench3600程度の性能と考えると4コアの第2世代Core i5程度の性能のマシンが手に入ってしまう感覚なので、980円ぐらいのお手頃VPSやレンタルサーバーを使っている場合、いらなくなる。残念ながらwindowsイメージのインスタンスは作れないが、メモリがたくさんあるのでwindowsでも使い物になりそうなスペック。

 

ラズパイ4で自宅サーバーを考えていましたが、4コアフルで使えるはずが思ったより随分性能が雑魚だった。公開サーバーや実験環境はオラクルクラウドでよい気がしてきた。

※AWS無料枠のt2.microのUnixBench スコア1174 (CPUクレジットあり)