vtr_flow/scripts/qor_compare.py - third_party/vtr-verilog-to-routing - Git at Google

 #!/usr/bin/env python2
 import argparse
 from collections import OrderedDict

 import openpyxl #Excel spreadsheet manipulation library
 from openpyxl.utils.dataframe import dataframe_to_rows
 from openpyxl.worksheet.cell_range import CellRange

 import pandas as pd

 DEFAULT_METRICS = [
     'num_pre_packed_blocks',
     'num_post_packed_blocks',
     'min_chan_width',
     'crit_path_routed_wirelength',
     'critical_path_delay',
     'device_grid_tiles',

     'vtr_flow_elapsed_time',
     'pack_time',
     'place_time',
     'min_chan_width_route_time',
     'crit_path_route_time',
     'max_vpr_mem',
 ]

 DEFAULT_KEYS = [
     'arch',
     'circuit',
 ]

 def parse_args():

     parser = argparse.ArgumentParser(description="Utility script to generate spreadsheets comparing VTR metric files")

     parser.add_argument("parse_result_files",
                         nargs="+",
                         metavar="PARSE_RESULT.TXT",
                         help="Set of metric files to compare")

     parser.add_argument("--result_names",
                         nargs="+",
                         metavar="RESULT_NAME",
                         help="Name of for each metric file (default: derived from filenames)")

     parser.add_argument("-o", "--output_spreadsheet",
                         metavar="OUTPUT.XLSX",
                         default="comparison_output.xlsx",
                         help="Output spreadsheet file (default: %(default)s)")

     parser.add_argument("--qor_metrics",
                         nargs="+",
                         default=DEFAULT_METRICS,
                         help="QoR Metrics to compare (default: %(default)s)")

     parser.add_argument("--keys",
                         nargs="+",
                         default=DEFAULT_KEYS,
                         help="Default keys to identify individiual experiments (default: %(default)s)")

     args = parser.parse_args()

     if not args.result_names or len(args.result_names) == 0:
         args.result_names = args.parse_result_files
     elif len(args.result_names) != len(args.parse_result_files):
         raise RuntimeError("Number of result names ({}) does not match number of result files ({})".format(len(args.result_names), len(args.parse_result_files)))
     else:
         assert len(args.result_names) == len(args.parse_result_files)

     return args

 def main():

     args = parse_args()

     wb = openpyxl.Workbook()

     wb.remove(wb.active)

     assert len(args.result_names) == len(args.parse_result_files)

     #Load all the raw data into separate sheets
     raw_sheets = OrderedDict()
     for i in xrange(len(args.parse_result_files)):
         sheet_name = safe_sheet_title("{}".format(args.result_names[i]))
         ws = parse_result_to_sheet(wb, args.parse_result_files[i], sheet_name)

         raw_sheets[sheet_name] = ws

     #Create sheet of ratios
     ratio_sheet = wb.create_sheet("ratios", index=0)
     ratio_ranges = make_ratios(ratio_sheet, raw_sheets, keys=args.keys, metrics=args.qor_metrics)

     #Create summary sheet
     summary_data_sheet = wb.create_sheet("summary_data", index=0)
     make_summary(summary_data_sheet, ratio_sheet, ratio_ranges, args.keys)

     summary_sheet = wb.create_sheet("summary", index=0)
     make_transpose(summary_sheet, summary_data_sheet)

     wb.save(args.output_spreadsheet)

 def make_transpose(dest_sheet, ref_sheet):

     for ref_row in xrange(ref_sheet.min_row, ref_sheet.max_row + 1):
         for ref_col in xrange(ref_sheet.min_column, ref_sheet.max_column + 1):
             ref_cell = ref_sheet.cell(row=ref_row, column=ref_col)

             dest_cell = dest_sheet.cell(row=ref_col, column=ref_row)
             dest_cell.value = "=IF(ISBLANK({cell}),\"\",{cell})".format(cell=value_ref(ref_cell))


 def make_summary(summary_sheet, ratio_sheet, ratio_ranges, keys):
     dest_row = 1
     for i, (ratio_name, cell_range) in enumerate(ratio_ranges.iteritems()):

         dest_col = 1

         if i == 0: #First range, copy headers

             dest_col += 1
             ratio_row = cell_range.min_row
             for j, ratio_col in enumerate(xrange(cell_range.min_col, cell_range.max_col + 1)):
                 ratio_cell = ratio_sheet.cell(row=ratio_row, column=ratio_col)

                 if j < len(keys):
                     continue
                 else:
                     dest_cell = summary_sheet.cell(row=dest_row, column=dest_col)
                     dest_cell.value = "={}".format(value_ref(ratio_cell))
                     dest_col += 1
             dest_row += 1
             dest_col = 1 #Reset for next row

         #
         #Data
         #

         #Ratio name
         dest_cell = summary_sheet.cell(row=dest_row, column=dest_col)
         dest_cell.value = ratio_name

         dest_col += 1

         #Ratio values
         ratio_row = cell_range.max_row #Geomean is in last row
         for ratio_col in xrange(cell_range.min_col + len(keys), cell_range.max_col + 1):
             ratio_cell = ratio_sheet.cell(row=ratio_row, column=ratio_col)

             dest_cell = summary_sheet.cell(row=dest_row, column=dest_col)
             dest_cell.value = "={}".format(value_ref(ratio_cell))

             dest_col += 1

         dest_row += 1

 def make_ratios(ratio_sheet, raw_sheets, keys, metrics):

     ref_sheet_title = raw_sheets.keys()[0]

     ref_sheet = raw_sheets[ref_sheet_title] #Get the first raw sheet

     cell_ranges = OrderedDict()

     row = 1
     for raw_sheet_title, raw_sheet in raw_sheets.iteritems():
         ratio_subtitle = ratio_sheet.cell(row=row, column=1)
         ratio_subtitle.value = raw_sheet_title
         row += 1


         cell_range = fill_ratio(ratio_sheet, raw_sheet, ref_sheet, dest_row=row, dest_col=1, keys=keys, metrics=metrics)
         row += cell_range.max_row - cell_range.min_row
         row += 2

         cell_ranges[raw_sheet_title] = cell_range

     return cell_ranges

 def fill_ratio(ws, raw_sheet, ref_sheet, dest_row, dest_col, keys, metrics):


     cell_range = CellRange(min_row=dest_row, max_row=dest_row,
                            min_col=dest_col, max_col=dest_col,
                            title=ws.title)


     link_sheet_header(ws, ref_sheet, row=dest_row, values=keys+metrics)
     dest_row += 1

     col_offset = 0
     for ref_col in xrange(1, ref_sheet.max_column + 1):
         ref_header = ref_sheet.cell(row=1, column=ref_col)
         raw_header = raw_sheet.cell(row=1, column=ref_col)

         ref_header_name = ref_header.value.strip()
         raw_header_name = ref_header.value.strip()
         assert ref_header_name == raw_header_name, "Header values must match"

         if ref_header_name not in keys + metrics:
             continue

         row_offset = 0
         for ref_row in xrange(2, ref_sheet.max_row + 1):

             ref_cell = ref_sheet.cell(row=ref_row, column=ref_col)
             raw_cell = raw_sheet.cell(row=ref_row, column=ref_col)

             dest_cell = ws.cell(row=dest_row + row_offset, column=dest_col + col_offset)


             if ref_header_name in keys:
                 assert ref_cell.value == raw_cell.value, "Key value must match"

                 dest_cell.value = "={}".format(value_ref(ref_cell))
             elif ref_header.value in metrics and ref_cell.data_type == ref_cell.TYPE_NUMERIC:
                 dest_cell.value = "={}".format(safe_ratio_ref(raw_cell, ref_cell))
             else:
                 pass
                 #assert False
             row_offset += 1

         #Last row: Add GEOMEAN
         dest_cell = ws.cell(row=dest_row + row_offset, column=dest_col + col_offset)
         if ref_header.value in keys:
             if keys.index(ref_header.value) == len(keys) - 1:
                 #Last key make geomean title
                 dest_cell.value = "GEOMEAN"
         else:
             start_cell = ws.cell(row=dest_row + row_offset - ref_sheet.max_row + 1, column=dest_col + col_offset)
             end_cell = ws.cell(row=dest_row + row_offset - 1, column=dest_col + col_offset)

             dest_cell.value = "=GEOMEAN({}:{})".format(start_cell.coordinate, end_cell.coordinate)

         row_offset += 1
         col_offset += 1

     cell_range.expand(down=row_offset, right=col_offset-1)

     return cell_range

 def value_ref(cell):
     return "{}!{}".format(cell.parent.title, cell.coordinate)

 def ratio_ref(num_cell, denom_cell):
     return "{num} / {denom}".format(num=value_ref(num_cell), denom=value_ref(denom_cell))

 def safe_ratio_ref(num_cell, denom_cell):
     return "IF(OR({denom} = 0,{denom}=-1),\"\",{num} / {denom})".format(num=value_ref(num_cell), denom=value_ref(denom_cell))

 def link_sheet_header(dest_sheet, ref_sheet, row, values=None):
     #Copy header
     dest_col = 1
     for col in xrange(1, ref_sheet.max_column + 1):

         ref_cell = ref_sheet.cell(row=1, column=col)

         if values != None and ref_cell.value.strip() not in values:
             continue

         dest_cell = dest_sheet.cell(row=row, column=dest_col)

         dest_cell.value = "={}".format(value_ref(ref_cell))

         dest_col += 1

 def parse_result_to_sheet(wb, parse_results_filename, sheet_name):

     #Load as CSV
     print "Loading", parse_results_filename
     df = pd.read_csv(parse_results_filename, sep='\t')

     #Add to sheet
     ws = wb.create_sheet(title=sheet_name)
     for row in dataframe_to_rows(df, index=False, header=True):
         ws.append(row)

     return ws

 def safe_sheet_title(raw_title):

     safe_title = raw_title

     for bad_char in ['/']:
         safe_title = safe_title.replace(bad_char, '_')

     return safe_title

 if __name__ == "__main__":
     main()
	#!/usr/bin/env python2
	import argparse
	from collections import OrderedDict

	import openpyxl #Excel spreadsheet manipulation library
	from openpyxl.utils.dataframe import dataframe_to_rows
	from openpyxl.worksheet.cell_range import CellRange

	import pandas as pd

	DEFAULT_METRICS = [
	'num_pre_packed_blocks',
	'num_post_packed_blocks',
	'min_chan_width',
	'crit_path_routed_wirelength',
	'critical_path_delay',
	'device_grid_tiles',

	'vtr_flow_elapsed_time',
	'pack_time',
	'place_time',
	'min_chan_width_route_time',
	'crit_path_route_time',
	'max_vpr_mem',
	]

	DEFAULT_KEYS = [
	'arch',
	'circuit',
	]

	def parse_args():

	parser = argparse.ArgumentParser(description="Utility script to generate spreadsheets comparing VTR metric files")

	parser.add_argument("parse_result_files",
	nargs="+",
	metavar="PARSE_RESULT.TXT",
	help="Set of metric files to compare")

	parser.add_argument("--result_names",
	nargs="+",
	metavar="RESULT_NAME",
	help="Name of for each metric file (default: derived from filenames)")

	parser.add_argument("-o", "--output_spreadsheet",
	metavar="OUTPUT.XLSX",
	default="comparison_output.xlsx",
	help="Output spreadsheet file (default: %(default)s)")

	parser.add_argument("--qor_metrics",
	nargs="+",
	default=DEFAULT_METRICS,
	help="QoR Metrics to compare (default: %(default)s)")

	parser.add_argument("--keys",
	nargs="+",
	default=DEFAULT_KEYS,
	help="Default keys to identify individiual experiments (default: %(default)s)")

	args = parser.parse_args()

	if not args.result_names or len(args.result_names) == 0:
	args.result_names = args.parse_result_files
	elif len(args.result_names) != len(args.parse_result_files):
	raise RuntimeError("Number of result names ({}) does not match number of result files ({})".format(len(args.result_names), len(args.parse_result_files)))
	else:
	assert len(args.result_names) == len(args.parse_result_files)

	return args

	def main():

	args = parse_args()

	wb = openpyxl.Workbook()

	wb.remove(wb.active)

	assert len(args.result_names) == len(args.parse_result_files)

	#Load all the raw data into separate sheets
	raw_sheets = OrderedDict()
	for i in xrange(len(args.parse_result_files)):
	sheet_name = safe_sheet_title("{}".format(args.result_names[i]))
	ws = parse_result_to_sheet(wb, args.parse_result_files[i], sheet_name)

	raw_sheets[sheet_name] = ws

	#Create sheet of ratios
	ratio_sheet = wb.create_sheet("ratios", index=0)
	ratio_ranges = make_ratios(ratio_sheet, raw_sheets, keys=args.keys, metrics=args.qor_metrics)

	#Create summary sheet
	summary_data_sheet = wb.create_sheet("summary_data", index=0)
	make_summary(summary_data_sheet, ratio_sheet, ratio_ranges, args.keys)

	summary_sheet = wb.create_sheet("summary", index=0)
	make_transpose(summary_sheet, summary_data_sheet)

	wb.save(args.output_spreadsheet)

	def make_transpose(dest_sheet, ref_sheet):

	for ref_row in xrange(ref_sheet.min_row, ref_sheet.max_row + 1):
	for ref_col in xrange(ref_sheet.min_column, ref_sheet.max_column + 1):
	ref_cell = ref_sheet.cell(row=ref_row, column=ref_col)

	dest_cell = dest_sheet.cell(row=ref_col, column=ref_row)
	dest_cell.value = "=IF(ISBLANK({cell}),\"\",{cell})".format(cell=value_ref(ref_cell))


	def make_summary(summary_sheet, ratio_sheet, ratio_ranges, keys):
	dest_row = 1
	for i, (ratio_name, cell_range) in enumerate(ratio_ranges.iteritems()):

	dest_col = 1

	if i == 0: #First range, copy headers

	dest_col += 1
	ratio_row = cell_range.min_row
	for j, ratio_col in enumerate(xrange(cell_range.min_col, cell_range.max_col + 1)):
	ratio_cell = ratio_sheet.cell(row=ratio_row, column=ratio_col)

	if j < len(keys):
	continue
	else:
	dest_cell = summary_sheet.cell(row=dest_row, column=dest_col)
	dest_cell.value = "={}".format(value_ref(ratio_cell))
	dest_col += 1
	dest_row += 1
	dest_col = 1 #Reset for next row

	#
	#Data
	#

	#Ratio name
	dest_cell = summary_sheet.cell(row=dest_row, column=dest_col)
	dest_cell.value = ratio_name

	dest_col += 1

	#Ratio values
	ratio_row = cell_range.max_row #Geomean is in last row
	for ratio_col in xrange(cell_range.min_col + len(keys), cell_range.max_col + 1):
	ratio_cell = ratio_sheet.cell(row=ratio_row, column=ratio_col)

	dest_cell = summary_sheet.cell(row=dest_row, column=dest_col)
	dest_cell.value = "={}".format(value_ref(ratio_cell))

	dest_col += 1

	dest_row += 1

	def make_ratios(ratio_sheet, raw_sheets, keys, metrics):

	ref_sheet_title = raw_sheets.keys()[0]

	ref_sheet = raw_sheets[ref_sheet_title] #Get the first raw sheet

	cell_ranges = OrderedDict()

	row = 1
	for raw_sheet_title, raw_sheet in raw_sheets.iteritems():
	ratio_subtitle = ratio_sheet.cell(row=row, column=1)
	ratio_subtitle.value = raw_sheet_title
	row += 1


	cell_range = fill_ratio(ratio_sheet, raw_sheet, ref_sheet, dest_row=row, dest_col=1, keys=keys, metrics=metrics)
	row += cell_range.max_row - cell_range.min_row
	row += 2

	cell_ranges[raw_sheet_title] = cell_range

	return cell_ranges

	def fill_ratio(ws, raw_sheet, ref_sheet, dest_row, dest_col, keys, metrics):


	cell_range = CellRange(min_row=dest_row, max_row=dest_row,
	min_col=dest_col, max_col=dest_col,
	title=ws.title)


	link_sheet_header(ws, ref_sheet, row=dest_row, values=keys+metrics)
	dest_row += 1

	col_offset = 0
	for ref_col in xrange(1, ref_sheet.max_column + 1):
	ref_header = ref_sheet.cell(row=1, column=ref_col)
	raw_header = raw_sheet.cell(row=1, column=ref_col)

	ref_header_name = ref_header.value.strip()
	raw_header_name = ref_header.value.strip()
	assert ref_header_name == raw_header_name, "Header values must match"

	if ref_header_name not in keys + metrics:
	continue

	row_offset = 0
	for ref_row in xrange(2, ref_sheet.max_row + 1):

	ref_cell = ref_sheet.cell(row=ref_row, column=ref_col)
	raw_cell = raw_sheet.cell(row=ref_row, column=ref_col)

	dest_cell = ws.cell(row=dest_row + row_offset, column=dest_col + col_offset)


	if ref_header_name in keys:
	assert ref_cell.value == raw_cell.value, "Key value must match"

	dest_cell.value = "={}".format(value_ref(ref_cell))
	elif ref_header.value in metrics and ref_cell.data_type == ref_cell.TYPE_NUMERIC:
	dest_cell.value = "={}".format(safe_ratio_ref(raw_cell, ref_cell))
	else:
	pass
	#assert False
	row_offset += 1

	#Last row: Add GEOMEAN
	dest_cell = ws.cell(row=dest_row + row_offset, column=dest_col + col_offset)
	if ref_header.value in keys:
	if keys.index(ref_header.value) == len(keys) - 1:
	#Last key make geomean title
	dest_cell.value = "GEOMEAN"
	else:
	start_cell = ws.cell(row=dest_row + row_offset - ref_sheet.max_row + 1, column=dest_col + col_offset)
	end_cell = ws.cell(row=dest_row + row_offset - 1, column=dest_col + col_offset)

	dest_cell.value = "=GEOMEAN({}:{})".format(start_cell.coordinate, end_cell.coordinate)

	row_offset += 1
	col_offset += 1

	cell_range.expand(down=row_offset, right=col_offset-1)

	return cell_range

	def value_ref(cell):
	return "{}!{}".format(cell.parent.title, cell.coordinate)

	def ratio_ref(num_cell, denom_cell):
	return "{num} / {denom}".format(num=value_ref(num_cell), denom=value_ref(denom_cell))

	def safe_ratio_ref(num_cell, denom_cell):
	return "IF(OR({denom} = 0,{denom}=-1),\"\",{num} / {denom})".format(num=value_ref(num_cell), denom=value_ref(denom_cell))

	def link_sheet_header(dest_sheet, ref_sheet, row, values=None):
	#Copy header
	dest_col = 1
	for col in xrange(1, ref_sheet.max_column + 1):

	ref_cell = ref_sheet.cell(row=1, column=col)

	if values != None and ref_cell.value.strip() not in values:
	continue

	dest_cell = dest_sheet.cell(row=row, column=dest_col)

	dest_cell.value = "={}".format(value_ref(ref_cell))

	dest_col += 1

	def parse_result_to_sheet(wb, parse_results_filename, sheet_name):

	#Load as CSV
	print "Loading", parse_results_filename
	df = pd.read_csv(parse_results_filename, sep='\t')

	#Add to sheet
	ws = wb.create_sheet(title=sheet_name)
	for row in dataframe_to_rows(df, index=False, header=True):
	ws.append(row)

	return ws

	def safe_sheet_title(raw_title):

	safe_title = raw_title

	for bad_char in ['/']:
	safe_title = safe_title.replace(bad_char, '_')

	return safe_title

	if __name__ == "__main__":
	main()