build_tools/benchmarks/comparisons/run_benchmarks.py - 3p/openxla/iree - Git at Google

 # Copyright 2022 The IREE Authors
 #
 # Licensed under the Apache License v2.0 with LLVM Exceptions.
 # See https://llvm.org/LICENSE.txt for license information.
 # SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
 """ Runs benchmarks and saves results to a .csv file

 Expects a directory structure of:
 <root-benchmark-dir>/
   └── ./benchmark_model (TFLite benchmark binary)
       ./iree-benchmark-module (IREE benchmark binary)
   ├── setup/
         ├── set_adreno_gpu_scaling_policy.sh
         ├── set_android_scaling_governor.sh
         └── set_pixel6_gpu_scaling_policy.sh
   ├── test_data/
   └── models/
         ├── tflite/*.tflite
         └── iree/
               └── <target>/*.vmfb e.g. llvm-cpu, vulkan, cuda.

 """

 import argparse
 import os

 from common.benchmark_runner import *
 from common.utils import *
 from mobilebert_fp32_commands import *
 from mobilebert_int8_commands import *
 from simple_commands import *


 def benchmark_desktop_cpu(
     device_name: str,
     command_factories: list[BenchmarkCommandFactory],
     results_path: str,
 ):
     benchmarks = []
     for factory in command_factories:
         benchmarks.extend(factory.generate_benchmark_commands("desktop", "cpu"))

     for num_threads in [1, 2, 4, 8]:
         for benchmark in benchmarks:
             results_array = [
                 device_name,
                 benchmark.model_name,
                 benchmark.runtime,
                 benchmark.driver,
                 num_threads,
             ]
             benchmark.num_threads = num_threads
             results_array.extend(run_command(benchmark))
             write_benchmark_result(results_array, results_path)


 def benchmark_desktop_gpu(
     device_name: str,
     command_factories: list[BenchmarkCommandFactory],
     results_path: str,
 ):
     benchmarks = []
     for factory in command_factories:
         benchmarks.extend(factory.generate_benchmark_commands("desktop", "gpu"))
     for benchmark in benchmarks:
         results_array = [
             device_name,
             benchmark.model_name,
             benchmark.runtime,
             benchmark.driver,
             benchmark.num_threads,
         ]
         results_array.extend(run_command(benchmark))
         write_benchmark_result(results_array, results_path)


 def benchmark_mobile_cpu(
     device_name: str,
     command_factories: list[BenchmarkCommandFactory],
     results_path: str,
 ):
     benchmarks = []
     for factory in command_factories:
         benchmarks.extend(factory.generate_benchmark_commands("mobile", "cpu"))

     for _, tuple in enumerate([("80", 1), ("C0", 2), ("F0", 4), ("0F", 4), ("FF", 8)]):
         taskset = tuple[0]
         num_threads = tuple[1]
         for benchmark in benchmarks:
             results_array = [
                 device_name,
                 benchmark.model_name,
                 benchmark.runtime,
                 benchmark.driver,
                 taskset,
                 num_threads,
             ]
             benchmark.taskset = taskset
             benchmark.num_threads = num_threads
             results_array.extend(run_command(benchmark))
             write_benchmark_result(results_array, results_path)


 def benchmark_mobile_gpu(
     device_name: str,
     command_factories: list[BenchmarkCommandFactory],
     results_path: str,
 ):
     benchmarks = []
     for factory in command_factories:
         benchmarks.extend(factory.generate_benchmark_commands("mobile", "gpu"))

     taskset = "80"
     num_threads = 1
     for benchmark in benchmarks:
         results_array = [
             device_name,
             benchmark.model_name,
             benchmark.runtime,
             benchmark.driver,
             taskset,
             num_threads,
         ]
         benchmark.taskset = taskset
         benchmark.num_threads = num_threads
         results_array.extend(run_command(benchmark))
         write_benchmark_result(results_array, results_path)


 def main(args):
     # Create factories for all models to be benchmarked.
     command_factory = []
     command_factory.append(
         MobilebertFP32CommandFactory(args.base_dir, "mobilebert_float_384_gpu")
     )
     command_factory.append(MobilebertInt8CommandFactory(args.base_dir))
     command_factory.append(
         MobilebertFP32CommandFactory(args.base_dir, "albert_lite_base_squadv1_1")
     )
     command_factory.append(
         SimpleCommandFactory(args.base_dir, "mobilenet_v2_1.0_224", "1x224x224x3xf32")
     )
     command_factory.append(
         SimpleCommandFactory(
             args.base_dir, "mobilenet_v2_224_1.0_uint8", "1x224x224x3xui8"
         )
     )
     command_factory.append(
         SimpleCommandFactory(args.base_dir, "deeplabv3", "1x257x257x3xf32")
     )
     command_factory.append(
         SimpleCommandFactory(args.base_dir, "person_detect", "1x96x96x1xi8")
     )
     command_factory.append(
         SimpleCommandFactory(
             args.base_dir, "ssd_mobilenet_v2_static_1.0_int8", "1x320x320x3xi8"
         )
     )
     command_factory.append(
         SimpleCommandFactory(
             args.base_dir, "resnet_v2_101_1_default_1", "1x299x299x3xf32"
         )
     )
     command_factory.append(
         SimpleCommandFactory(
             args.base_dir, "ssd_mobilenet_v2_fpnlite_uint8", "1x320x320x3xui8"
         )
     )
     command_factory.append(
         SimpleCommandFactory(
             args.base_dir, "ssd_mobilenet_v2_fpnlite_fp32", "1x320x320x3xf32"
         )
     )
     command_factory.append(
         SimpleCommandFactory(
             args.base_dir, "efficientnet_lite0_int8_2", "1x224x224x3xui8"
         )
     )
     command_factory.append(
         SimpleCommandFactory(
             args.base_dir, "efficientnet_lite0_fp32_2", "1x224x224x3xf32"
         )
     )
     command_factory.append(
         SimpleCommandFactory(args.base_dir, "inception_v4_299_uint8", "1x299x299x3xui8")
     )
     command_factory.append(
         SimpleCommandFactory(args.base_dir, "inception_v4_299_fp32", "1x299x299x3xf32")
     )

     if args.mode == "desktop":
         results_path = os.path.join(args.output_dir, "results.csv")
         with open(results_path, "w") as f:
             f.write(
                 "device,model,runtime,driver/delegate,threads,latency (ms),vmhwm (KB),vmrss (KB),rssfile (KB)\n"
             )

         if not args.disable_cpu:
             benchmark_desktop_cpu(args.device_name, command_factory, results_path)
         if not args.disable_gpu:
             benchmark_desktop_gpu(args.device_name, command_factory, results_path)
     else:
         assert args.mode == "mobile"
         results_path = os.path.join(args.output_dir, "results.csv")
         with open(results_path, "w") as f:
             f.write(
                 "device,model,runtime,driver/delegate,taskset,threads,latency (ms),vmhwm (KB),vmrss (KB),rssfile (KB)\n"
             )
         if not args.disable_cpu:
             benchmark_mobile_cpu(args.device_name, command_factory, results_path)
         if not args.disable_gpu:
             benchmark_mobile_gpu(args.device_name, command_factory, results_path)


 def parse_args():
     parser = argparse.ArgumentParser()
     parser.add_argument(
         "--device_name",
         type=str,
         default=None,
         help="The name of the device the benchmark is running on e.g. Pixel 6",
     )
     parser.add_argument(
         "--base_dir",
         type=str,
         default=None,
         help="The directory where all benchmarking artifacts are located.",
     )
     parser.add_argument(
         "--output_dir",
         type=str,
         default=None,
         help="The directory to save output artifacts into.",
     )
     parser.add_argument(
         "--mode",
         type=str,
         choices=("desktop", "mobile"),
         default="desktop",
         help="The benchmarking mode to use. If mode is `mobile`, uses tasksets.",
     )
     parser.add_argument(
         "--disable_cpu", action="store_true", help="Disables running benchmarks on CPU."
     )
     parser.add_argument(
         "--disable_gpu", action="store_true", help="Disables running benchmarks on GPU."
     )
     return parser.parse_args()


 if __name__ == "__main__":
     main(parse_args())
	# Copyright 2022 The IREE Authors
	#
	# Licensed under the Apache License v2.0 with LLVM Exceptions.
	# See https://llvm.org/LICENSE.txt for license information.
	# SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
	""" Runs benchmarks and saves results to a .csv file

	Expects a directory structure of:
	<root-benchmark-dir>/
	└── ./benchmark_model (TFLite benchmark binary)
	./iree-benchmark-module (IREE benchmark binary)
	├── setup/
	├── set_adreno_gpu_scaling_policy.sh
	├── set_android_scaling_governor.sh
	└── set_pixel6_gpu_scaling_policy.sh
	├── test_data/
	└── models/
	├── tflite/*.tflite
	└── iree/
	└── <target>/*.vmfb e.g. llvm-cpu, vulkan, cuda.

	"""

	import argparse
	import os

	from common.benchmark_runner import *
	from common.utils import *
	from mobilebert_fp32_commands import *
	from mobilebert_int8_commands import *
	from simple_commands import *


	def benchmark_desktop_cpu(
	device_name: str,
	command_factories: list[BenchmarkCommandFactory],
	results_path: str,
	):
	benchmarks = []
	for factory in command_factories:
	benchmarks.extend(factory.generate_benchmark_commands("desktop", "cpu"))

	for num_threads in [1, 2, 4, 8]:
	for benchmark in benchmarks:
	results_array = [
	device_name,
	benchmark.model_name,
	benchmark.runtime,
	benchmark.driver,
	num_threads,
	]
	benchmark.num_threads = num_threads
	results_array.extend(run_command(benchmark))
	write_benchmark_result(results_array, results_path)


	def benchmark_desktop_gpu(
	device_name: str,
	command_factories: list[BenchmarkCommandFactory],
	results_path: str,
	):
	benchmarks = []
	for factory in command_factories:
	benchmarks.extend(factory.generate_benchmark_commands("desktop", "gpu"))
	for benchmark in benchmarks:
	results_array = [
	device_name,
	benchmark.model_name,
	benchmark.runtime,
	benchmark.driver,
	benchmark.num_threads,
	]
	results_array.extend(run_command(benchmark))
	write_benchmark_result(results_array, results_path)


	def benchmark_mobile_cpu(
	device_name: str,
	command_factories: list[BenchmarkCommandFactory],
	results_path: str,
	):
	benchmarks = []
	for factory in command_factories:
	benchmarks.extend(factory.generate_benchmark_commands("mobile", "cpu"))

	for _, tuple in enumerate([("80", 1), ("C0", 2), ("F0", 4), ("0F", 4), ("FF", 8)]):
	taskset = tuple[0]
	num_threads = tuple[1]
	for benchmark in benchmarks:
	results_array = [
	device_name,
	benchmark.model_name,
	benchmark.runtime,
	benchmark.driver,
	taskset,
	num_threads,
	]
	benchmark.taskset = taskset
	benchmark.num_threads = num_threads
	results_array.extend(run_command(benchmark))
	write_benchmark_result(results_array, results_path)


	def benchmark_mobile_gpu(
	device_name: str,
	command_factories: list[BenchmarkCommandFactory],
	results_path: str,
	):
	benchmarks = []
	for factory in command_factories:
	benchmarks.extend(factory.generate_benchmark_commands("mobile", "gpu"))

	taskset = "80"
	num_threads = 1
	for benchmark in benchmarks:
	results_array = [
	device_name,
	benchmark.model_name,
	benchmark.runtime,
	benchmark.driver,
	taskset,
	num_threads,
	]
	benchmark.taskset = taskset
	benchmark.num_threads = num_threads
	results_array.extend(run_command(benchmark))
	write_benchmark_result(results_array, results_path)


	def main(args):
	# Create factories for all models to be benchmarked.
	command_factory = []
	command_factory.append(
	MobilebertFP32CommandFactory(args.base_dir, "mobilebert_float_384_gpu")
	)
	command_factory.append(MobilebertInt8CommandFactory(args.base_dir))
	command_factory.append(
	MobilebertFP32CommandFactory(args.base_dir, "albert_lite_base_squadv1_1")
	)
	command_factory.append(
	SimpleCommandFactory(args.base_dir, "mobilenet_v2_1.0_224", "1x224x224x3xf32")
	)
	command_factory.append(
	SimpleCommandFactory(
	args.base_dir, "mobilenet_v2_224_1.0_uint8", "1x224x224x3xui8"
	)
	)
	command_factory.append(
	SimpleCommandFactory(args.base_dir, "deeplabv3", "1x257x257x3xf32")
	)
	command_factory.append(
	SimpleCommandFactory(args.base_dir, "person_detect", "1x96x96x1xi8")
	)
	command_factory.append(
	SimpleCommandFactory(
	args.base_dir, "ssd_mobilenet_v2_static_1.0_int8", "1x320x320x3xi8"
	)
	)
	command_factory.append(
	SimpleCommandFactory(
	args.base_dir, "resnet_v2_101_1_default_1", "1x299x299x3xf32"
	)
	)
	command_factory.append(
	SimpleCommandFactory(
	args.base_dir, "ssd_mobilenet_v2_fpnlite_uint8", "1x320x320x3xui8"
	)
	)
	command_factory.append(
	SimpleCommandFactory(
	args.base_dir, "ssd_mobilenet_v2_fpnlite_fp32", "1x320x320x3xf32"
	)
	)
	command_factory.append(
	SimpleCommandFactory(
	args.base_dir, "efficientnet_lite0_int8_2", "1x224x224x3xui8"
	)
	)
	command_factory.append(
	SimpleCommandFactory(
	args.base_dir, "efficientnet_lite0_fp32_2", "1x224x224x3xf32"
	)
	)
	command_factory.append(
	SimpleCommandFactory(args.base_dir, "inception_v4_299_uint8", "1x299x299x3xui8")
	)
	command_factory.append(
	SimpleCommandFactory(args.base_dir, "inception_v4_299_fp32", "1x299x299x3xf32")
	)

	if args.mode == "desktop":
	results_path = os.path.join(args.output_dir, "results.csv")
	with open(results_path, "w") as f:
	f.write(
	"device,model,runtime,driver/delegate,threads,latency (ms),vmhwm (KB),vmrss (KB),rssfile (KB)\n"
	)

	if not args.disable_cpu:
	benchmark_desktop_cpu(args.device_name, command_factory, results_path)
	if not args.disable_gpu:
	benchmark_desktop_gpu(args.device_name, command_factory, results_path)
	else:
	assert args.mode == "mobile"
	results_path = os.path.join(args.output_dir, "results.csv")
	with open(results_path, "w") as f:
	f.write(
	"device,model,runtime,driver/delegate,taskset,threads,latency (ms),vmhwm (KB),vmrss (KB),rssfile (KB)\n"
	)
	if not args.disable_cpu:
	benchmark_mobile_cpu(args.device_name, command_factory, results_path)
	if not args.disable_gpu:
	benchmark_mobile_gpu(args.device_name, command_factory, results_path)


	def parse_args():
	parser = argparse.ArgumentParser()
	parser.add_argument(
	"--device_name",
	type=str,
	default=None,
	help="The name of the device the benchmark is running on e.g. Pixel 6",
	)
	parser.add_argument(
	"--base_dir",
	type=str,
	default=None,
	help="The directory where all benchmarking artifacts are located.",
	)
	parser.add_argument(
	"--output_dir",
	type=str,
	default=None,
	help="The directory to save output artifacts into.",
	)
	parser.add_argument(
	"--mode",
	type=str,
	choices=("desktop", "mobile"),
	default="desktop",
	help="The benchmarking mode to use. If mode is `mobile`, uses tasksets.",
	)
	parser.add_argument(
	"--disable_cpu", action="store_true", help="Disables running benchmarks on CPU."
	)
	parser.add_argument(
	"--disable_gpu", action="store_true", help="Disables running benchmarks on GPU."
	)
	return parser.parse_args()


	if __name__ == "__main__":
	main(parse_args())