Reading from finite sets of CSV columns and outputing as rows to a specific JSON schema

Question 1

I would iterate over each row of the CSV and use a dictionary that has already passed rows (I am assuming a combination of name/subname)

data = {}
for row in words:
    if not row["name"] + "-" + row["subname"] in data:
        data[row["name"] + "-" + row["subname"]] = {
            "name": row["name"],
            "subname": row["subname"],
            "data": {
                "attr1": {"name":"value1", "values": []},
                "attr2": {"name":"value2", "values": []}
            }
        }
    data[row["name"] + "-" + row["subname"]]["data"]["attr1"]["values"].append(row["value1"])
    data[row["name"] + "-" + row["subname"]]["data"]["attr2"]["values"].append(row["value2"])

Question 2

My approach which I find very readable would be as follows:

import csv,pprint
from itertools import groupby

with open('tsv.csv') as f:
    values = []
    reader = csv.DictReader(f)
    for group in ( list(g) for k,g in groupby(reader,lambda r: r["name"])): #group by the name column of each row
        #group looks like [ {'subname': 'a', 'value2': '25', 'value1': '5', 'name': 'b'},...]
        groupRep = {"name":group[0]["name"], #get the name from the first group
                    "subname":group[0]["subname"], #get the subname from the first group
                    "data":{
                        "attr1":{"name":"value1","values":[]}, #make place to store value1s
                        "attr2":{"name":"value2","values":[]} #make place to store value2s
                        }
                    }
        for row in group:
        #each row is a dictionary like {'subname': 'a', 'value2': '25', 'value1': '5', 'name': 'b'}
            groupRep["data"]["attr1"]["values"].append(row["value1"])
            groupRep["data"]["attr2"]["values"].append(row["value2"])
        #store the representation of the group in values
        values.append(groupRep)

Pretty Printing:

PP = pprint.PrettyPrinter()       
PP.pprint(values)

Gets:

[{'data': {'attr1': {'name': 'value1', 'values': ['1', '2', '3', '4']},
           'attr2': {'name': 'value2', 'values': ['21', '22', '23', '24']}},
  'name': 'a',
  'subname': 'a'},
 {'data': {'attr1': {'name': 'value1', 'values': ['5', '6', '7', '8']},
           'attr2': {'name': 'value2', 'values': ['25', '26', '27', '2']}},
  'name': 'b',
  'subname': 'a'},
 {'data': {'attr1': {'name': 'value1', 'values': ['9', '1', '1', '1']},
           'attr2': {'name': 'value2', 'values': ['29', '30', '31', '32']}},
  'name': 'c',
  'subname': 'c'}]