Построение гистограммы:Как я могу сделать это с нуля, используя данные, хранящиеся в базе данных?
Вопрос
У меня есть некоторые данные, хранящиеся в базе данных, подобной этой:
Имя таблицы:неисправности Таблица:
+------------+--------------+
| fault_type | total |
+------------+--------------+
| 1 | 1 |
| 2 | 3 |
| 3 | 8 |
| 4 | 2 |
.............................
Как я должен получить график гистограммы, начиная с этой таблицы?
Решение
Приведенное ниже решение предполагает, что у вас есть MySQL, Python и GNUPlot.При необходимости конкретные детали могут быть точно настроены.Разместите его так, чтобы он мог стать основой для других одноранговых узлов.
Шаг №1:Определите тип графика.
Если это какой-то частотный график, то простой SQL-запрос должен сделать свое дело:
select total, count(total) from faults GROUP BY total;
Если вам нужно указать размеры ячеек, то переходите к следующему шагу.
Шаг №2:Убедитесь, что вы можете подключиться к MySQL с помощью Python.Для этого вы можете использовать импорт MySQLdb.
После этого следующий код python для генерации данных для построения гистограммы (он был написан ровно за 5 минут, поэтому он очень грубый):
import MySQLdb
def DumpHistogramData(databaseHost, databaseName, databaseUsername, databasePassword, dataTableName, binsTableName, binSize, histogramDataFilename):
#Open a file for writing into
output = open("./" + histogramDataFilename, "w")
#Connect to the database
db = MySQLdb.connect(databaseHost, databaseUsername, databasePassword, databaseName)
cursor = db.cursor()
#Form the query
sql = """select b.*, count(*) as total
FROM """ + binsTableName + """ b
LEFT OUTER JOIN """ + dataTableName + """ a
ON a.total between b.min AND b.max
group by b.min;"""
cursor.execute(sql)
#Get the result and print it into a file for further processing
count = 0;
while True:
results = cursor.fetchmany(10000)
if not results:
break
for result in results:
#print >> output, str(result[0]) + "-" + str(result[1]) + "\t" + str(result[2])
db.close()
def PrepareHistogramBins(databaseHost, databaseName, databaseUsername, databasePassword, binsTableName, maxValue, totalBins):
#Connect to the database
db = MySQLdb.connect(databaseHost, databaseUsername, databasePassword, databaseName)
cursor = db.cursor()
#Check if the table was already created
sql = """DROP TABLE IF EXISTS """ + binsTableName
cursor.execute(sql)
#Create the table
sql = """CREATE TABLE """ + binsTableName + """(min int(11), max int(11));"""
cursor.execute(sql)
#Calculate the bin size
binSize = maxValue/totalBins
#Generate the bin sizes
for i in range(0, maxValue, binSize):
if i is 0:
min = i
max = i+binSize
else:
min = i+1
max = i+binSize
sql = """INSERT INTO """ + binsTableName + """(min, max) VALUES(""" + str(min) + """, """ + str(max) + """);"""
cursor.execute(sql)
db.close()
return binSize
binSize = PrepareHistogramBins("localhost", "testing", "root", "", "bins", 5000, 100)
DumpHistogramData("localhost", "testing", "root", "", "faults", "bins", binSize, "histogram")
Шаг №3:Используйте GNUPlot для создания гистограммы.Вы можете использовать следующий скрипт в качестве отправной точки (генерирует файл изображения eps).:
set terminal postscript eps color lw 2 "Helvetica" 20
set output "output.eps"
set xlabel "XLABEL"
set ylabel "YLABEL"
set title "TITLE"
set style data histogram
set style histogram cluster gap 1
set style fill solid border -1
set boxwidth 0.9
set key autotitle columnheader
set xtics rotate by -45
plot "input" using 1:2 with linespoints ls 1
Сохраните приведенный выше скрипт в какой-нибудь произвольный файл, скажем, sample.script.Переходите к следующему шагу.
Шаг №4:Используйте gnuplot с приведенным выше скриптом ввода для создания eps-файла
gnuplot sample.script
Ничего сложного, но я подумал, что пару битов из этого кода можно использовать повторно.Опять же, как я уже сказал, это не идеально, но вы можете выполнить свою работу :)
Реквизиты:
Офри Равив (за помощь мне с запросом MySQL в этом посте:Получение данных для построения гистограммы)
Сам (за написание python и скрипта gnuplot :D)
Другие советы
Эта статья в блоге может помочь вам!В нем говорится о статистике с использованием gnuplot и выводится результат в виде гистограммы.