Blame classify.c

Packit 9eaa09
#include "config.h"
Packit 9eaa09
#include <stdlib.h>
Packit 9eaa09
#include <stdio.h>
Packit 9eaa09
#include <unistd.h>
Packit 9eaa09
#include <sys/types.h>
Packit 9eaa09
#include <dirent.h>
Packit 9eaa09
#include <assert.h>
Packit 9eaa09
#include <errno.h>
Packit 9eaa09
Packit 9eaa09
#include "irqbalance.h"
Packit 9eaa09
#include "types.h"
Packit 9eaa09
Packit 9eaa09
Packit 9eaa09
char *classes[] = {
Packit 9eaa09
	"other",
Packit 9eaa09
	"legacy",
Packit 9eaa09
	"storage",
Packit 9eaa09
	"video",
Packit 9eaa09
	"ethernet",
Packit 9eaa09
	"gbit-ethernet",
Packit 9eaa09
	"10gbit-ethernet",
Packit 9eaa09
	"virt-event",
Packit 9eaa09
	0
Packit 9eaa09
};
Packit 9eaa09
Packit 9eaa09
static int map_class_to_level[8] =
Packit 9eaa09
{ BALANCE_PACKAGE, BALANCE_CACHE, BALANCE_CORE, BALANCE_CORE, BALANCE_CORE, BALANCE_CORE, BALANCE_CORE, BALANCE_CORE };
Packit 9eaa09
Packit 9eaa09
struct user_irq_policy {
Packit 9eaa09
	int ban;
Packit 9eaa09
	int level;
Packit 9eaa09
	int numa_node_set;
Packit 9eaa09
	int numa_node;
Packit 9eaa09
};
Packit 9eaa09
Packit 9eaa09
static GList *interrupts_db = NULL;
Packit 9eaa09
static GList *banned_irqs = NULL;
Packit 9eaa09
GList *cl_banned_irqs = NULL;
Packit 9eaa09
static GList *cl_banned_modules = NULL;
Packit 9eaa09
Packit 9eaa09
#define SYSFS_DIR "/sys"
Packit 9eaa09
#define SYSDEV_DIR "/sys/bus/pci/devices"
Packit 9eaa09
Packit 9eaa09
#define PCI_MAX_CLASS 0x14
Packit 9eaa09
#define PCI_MAX_SERIAL_SUBCLASS 0x81
Packit 9eaa09
Packit 9eaa09
#define PCI_INVAL_DATA 0xFFFFFFFF
Packit 9eaa09
Packit 9eaa09
struct pci_info {
Packit 9eaa09
	unsigned short vendor;
Packit 9eaa09
	unsigned short device;
Packit 9eaa09
	unsigned short sub_vendor;
Packit 9eaa09
	unsigned short sub_device;
Packit 9eaa09
	unsigned int class;
Packit 9eaa09
};
Packit 9eaa09
Packit 9eaa09
/* PCI vendor ID, device ID */
Packit 9eaa09
#define PCI_VENDOR_PLX 0x10b5
Packit 9eaa09
#define PCI_DEVICE_PLX_PEX8619 0x8619
Packit 9eaa09
#define PCI_VENDOR_CAVIUM 0x177d
Packit 9eaa09
#define PCI_DEVICE_CAVIUM_CN61XX 0x0093
Packit 9eaa09
Packit 9eaa09
/* PCI subsystem vendor ID, subsystem device ID */
Packit 9eaa09
#define PCI_SUB_VENDOR_EMC 0x1120
Packit 9eaa09
#define PCI_SUB_DEVICE_EMC_055B 0x055b
Packit 9eaa09
#define PCI_SUB_DEVICE_EMC_0568 0x0568
Packit 9eaa09
#define PCI_SUB_DEVICE_EMC_dd00 0xdd00
Packit 9eaa09
Packit 9eaa09
/*
Packit 9eaa09
 * Apply software workarounds for some special devices
Packit 9eaa09
 *
Packit 9eaa09
 * The world is not perfect and supplies us with broken PCI devices.
Packit 9eaa09
 * Usually there are two sort of cases:
Packit 9eaa09
 *
Packit 9eaa09
 *     1. The device is special
Packit 9eaa09
 *        Before shipping the devices, PCI spec doesn't have the definitions.
Packit 9eaa09
 *
Packit 9eaa09
 *     2. Buggy PCI devices
Packit 9eaa09
 *        Some PCI devices don't follow the PCI class code definitions.
Packit 9eaa09
 */
Packit 9eaa09
static void apply_pci_quirks(const struct pci_info *pci, int *irq_class)
Packit 9eaa09
{
Packit 9eaa09
	if ((pci->vendor == PCI_VENDOR_PLX) &&
Packit 9eaa09
	    (pci->device == PCI_DEVICE_PLX_PEX8619) &&
Packit 9eaa09
	    (pci->sub_vendor == PCI_SUB_VENDOR_EMC)) {
Packit 9eaa09
		switch (pci->sub_device) {
Packit 9eaa09
			case PCI_SUB_DEVICE_EMC_055B:
Packit 9eaa09
			case PCI_SUB_DEVICE_EMC_dd00:
Packit 9eaa09
				*irq_class = IRQ_SCSI;
Packit 9eaa09
				break;
Packit 9eaa09
		}
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	if ((pci->vendor == PCI_VENDOR_CAVIUM) &&
Packit 9eaa09
	    (pci->device == PCI_DEVICE_CAVIUM_CN61XX) &&
Packit 9eaa09
	    (pci->sub_vendor == PCI_SUB_VENDOR_EMC)) {
Packit 9eaa09
		switch (pci->sub_device) {
Packit 9eaa09
			case PCI_SUB_DEVICE_EMC_0568:
Packit 9eaa09
				*irq_class = IRQ_SCSI;
Packit 9eaa09
				break;
Packit 9eaa09
		}
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	return;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
/* Determin IRQ class based on PCI class code */
Packit 9eaa09
static int map_pci_irq_class(unsigned int pci_class)
Packit 9eaa09
{
Packit 9eaa09
	unsigned int major = pci_class >> 16;
Packit 9eaa09
	unsigned int sub = (pci_class & 0xFF00) >> 8;
Packit 9eaa09
	int irq_class = IRQ_NODEF;
Packit 9eaa09
	/*
Packit 9eaa09
	 * Class codes lifted from below PCI-SIG spec:
Packit 9eaa09
	 *
Packit 9eaa09
	 * PCI Code and ID Assignment Specification v1.5
Packit 9eaa09
	 *
Packit 9eaa09
	 * and mapped to irqbalance types here.
Packit 9eaa09
	 *
Packit 9eaa09
	 * IRQ_NODEF will go through classification by PCI sub-class code.
Packit 9eaa09
	 */
Packit 9eaa09
	static short major_class_codes[PCI_MAX_CLASS] = {
Packit 9eaa09
		IRQ_OTHER,
Packit 9eaa09
		IRQ_SCSI,
Packit 9eaa09
		IRQ_ETH,
Packit 9eaa09
		IRQ_VIDEO,
Packit 9eaa09
		IRQ_OTHER,
Packit 9eaa09
		IRQ_OTHER,
Packit 9eaa09
		IRQ_LEGACY,
Packit 9eaa09
		IRQ_OTHER,
Packit 9eaa09
		IRQ_OTHER,
Packit 9eaa09
		IRQ_LEGACY,
Packit 9eaa09
		IRQ_OTHER,
Packit 9eaa09
		IRQ_OTHER,
Packit 9eaa09
		IRQ_NODEF,
Packit 9eaa09
		IRQ_ETH,
Packit 9eaa09
		IRQ_SCSI,
Packit 9eaa09
		IRQ_OTHER,
Packit 9eaa09
		IRQ_OTHER,
Packit 9eaa09
		IRQ_OTHER,
Packit 9eaa09
		IRQ_LEGACY,
Packit 9eaa09
		IRQ_LEGACY,
Packit 9eaa09
	};
Packit 9eaa09
Packit 9eaa09
	/*
Packit 9eaa09
	 * All sub-class code for serial bus controllers.
Packit 9eaa09
	 * The major class code is 0xc.
Packit 9eaa09
	 */
Packit 9eaa09
	static short serial_sub_codes[PCI_MAX_SERIAL_SUBCLASS] = {
Packit 9eaa09
		IRQ_LEGACY,
Packit 9eaa09
		IRQ_LEGACY,
Packit 9eaa09
		IRQ_LEGACY,
Packit 9eaa09
		IRQ_LEGACY,
Packit 9eaa09
		IRQ_SCSI,
Packit 9eaa09
		IRQ_LEGACY,
Packit 9eaa09
		IRQ_SCSI,
Packit 9eaa09
		IRQ_LEGACY,
Packit 9eaa09
		IRQ_LEGACY,
Packit 9eaa09
		IRQ_LEGACY,
Packit 9eaa09
		[0xa ... 0x7f] = IRQ_NODEF,
Packit 9eaa09
		IRQ_LEGACY,
Packit 9eaa09
	};
Packit 9eaa09
Packit 9eaa09
	/*
Packit 9eaa09
	 * Check major class code first
Packit 9eaa09
	 */
Packit 9eaa09
Packit 9eaa09
	if (major >= PCI_MAX_CLASS)
Packit 9eaa09
		return IRQ_NODEF;
Packit 9eaa09
Packit 9eaa09
	switch (major) {
Packit 9eaa09
		case 0xc: /* Serial bus class */
Packit 9eaa09
			if (sub >= PCI_MAX_SERIAL_SUBCLASS)
Packit 9eaa09
				return IRQ_NODEF;
Packit 9eaa09
			irq_class = serial_sub_codes[sub];
Packit 9eaa09
			break;
Packit 9eaa09
		default: /* All other PCI classes */
Packit 9eaa09
			irq_class = major_class_codes[major];
Packit 9eaa09
			break;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	return irq_class;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
/* Read specific data from sysfs */
Packit 9eaa09
static unsigned int read_pci_data(const char *devpath, const char* file)
Packit 9eaa09
{
Packit 9eaa09
	char path[PATH_MAX];
Packit 9eaa09
	FILE *fd;
Packit 9eaa09
	unsigned int data = PCI_INVAL_DATA;
Packit 9eaa09
Packit 9eaa09
	sprintf(path, "%s/%s", devpath, file);
Packit 9eaa09
Packit 9eaa09
	fd = fopen(path, "r");
Packit 9eaa09
Packit 9eaa09
	if (!fd) {
Packit 9eaa09
		log(TO_CONSOLE, LOG_WARNING, "PCI: can't open file:%s\n", path);
Packit 9eaa09
		return data;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	(void) fscanf(fd, "%x", &data);
Packit 9eaa09
	fclose(fd);
Packit 9eaa09
Packit 9eaa09
	return data;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
/* Get pci information for IRQ classification */
Packit 9eaa09
static int get_pci_info(const char *devpath, struct pci_info *pci)
Packit 9eaa09
{
Packit 9eaa09
	unsigned int data = PCI_INVAL_DATA;
Packit 9eaa09
Packit 9eaa09
	if ((data = read_pci_data(devpath, "vendor")) == PCI_INVAL_DATA)
Packit 9eaa09
		return -ENODEV;
Packit 9eaa09
	pci->vendor = (unsigned short)data;
Packit 9eaa09
Packit 9eaa09
	if ((data = read_pci_data(devpath, "device")) == PCI_INVAL_DATA)
Packit 9eaa09
		return -ENODEV;
Packit 9eaa09
	pci->device = (unsigned short)data;
Packit 9eaa09
Packit 9eaa09
	if ((data = read_pci_data(devpath, "subsystem_vendor")) == PCI_INVAL_DATA)
Packit 9eaa09
		return -ENODEV;
Packit 9eaa09
	pci->sub_vendor = (unsigned short)data;
Packit 9eaa09
Packit 9eaa09
	if ((data = read_pci_data(devpath, "subsystem_device")) == PCI_INVAL_DATA)
Packit 9eaa09
		return -ENODEV;
Packit 9eaa09
	pci->sub_device = (unsigned short)data;
Packit 9eaa09
Packit 9eaa09
	if ((data = read_pci_data(devpath, "class")) == PCI_INVAL_DATA)
Packit 9eaa09
		return -ENODEV;
Packit 9eaa09
	pci->class = data;
Packit 9eaa09
Packit 9eaa09
	return 0;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
/* Return IRQ class for given devpath */
Packit 9eaa09
static int get_irq_class(const char *devpath)
Packit 9eaa09
{
Packit 9eaa09
	int irq_class = IRQ_NODEF;
Packit 9eaa09
	struct pci_info pci;
Packit 9eaa09
Packit 9eaa09
	/* Get PCI info from sysfs */
Packit 9eaa09
	if (get_pci_info(devpath, &pci) < 0)
Packit 9eaa09
		return IRQ_NODEF;
Packit 9eaa09
Packit 9eaa09
	/* Map PCI class code to irq class */
Packit 9eaa09
	irq_class = map_pci_irq_class(pci.class);
Packit 9eaa09
	if (irq_class < 0) {
Packit 9eaa09
		log(TO_CONSOLE, LOG_WARNING, "Invalid PCI class code %d\n",
Packit 9eaa09
		    pci.class);
Packit 9eaa09
		return IRQ_NODEF;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	/* Reassign irq class for some buggy devices */
Packit 9eaa09
	apply_pci_quirks(&pci, &irq_class);
Packit 9eaa09
Packit 9eaa09
	return irq_class;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
static gint compare_ints(gconstpointer a, gconstpointer b)
Packit 9eaa09
{
Packit 9eaa09
	const struct irq_info *ai = a;
Packit 9eaa09
	const struct irq_info *bi = b;
Packit 9eaa09
Packit 9eaa09
	return ai->irq - bi->irq;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
static void add_banned_irq(int irq, GList **list)
Packit 9eaa09
{
Packit 9eaa09
	struct irq_info find, *new;
Packit 9eaa09
	GList *entry;
Packit 9eaa09
Packit 9eaa09
	find.irq = irq;
Packit 9eaa09
	entry = g_list_find_custom(*list, &find, compare_ints);
Packit 9eaa09
	if (entry)
Packit 9eaa09
		return;
Packit 9eaa09
Packit 9eaa09
	new = calloc(sizeof(struct irq_info), 1);
Packit 9eaa09
	if (!new) {
Packit 9eaa09
		log(TO_CONSOLE, LOG_WARNING, "No memory to ban irq %d\n", irq);
Packit 9eaa09
		return;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	new->irq = irq;
Packit 9eaa09
	new->flags |= IRQ_FLAG_BANNED;
Packit 9eaa09
Packit 9eaa09
	*list = g_list_append(*list, new);
Packit 9eaa09
	log(TO_CONSOLE, LOG_INFO, "IRQ %d was BANNED.\n", irq);
Packit 9eaa09
	return;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
void add_cl_banned_irq(int irq)
Packit 9eaa09
{
Packit 9eaa09
	add_banned_irq(irq, &cl_banned_irqs);
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
static int is_banned_irq(int irq)
Packit 9eaa09
{
Packit 9eaa09
	GList *entry;
Packit 9eaa09
	struct irq_info find;
Packit 9eaa09
Packit 9eaa09
	find.irq = irq;
Packit 9eaa09
Packit 9eaa09
	entry = g_list_find_custom(banned_irqs, &find, compare_ints);
Packit 9eaa09
	return entry ? 1:0;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
gint substr_find(gconstpointer a, gconstpointer b)
Packit 9eaa09
{
Packit 9eaa09
	if (strstr(b, a))
Packit 9eaa09
		return 0;
Packit 9eaa09
	else
Packit 9eaa09
		return 1;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
static void add_banned_module(char *modname, GList **modlist)
Packit 9eaa09
{
Packit 9eaa09
	GList *entry;
Packit 9eaa09
	char *newmod;
Packit 9eaa09
	
Packit 9eaa09
	entry = g_list_find_custom(*modlist, modname, substr_find);
Packit 9eaa09
	if (entry)
Packit 9eaa09
		return;
Packit 9eaa09
Packit 9eaa09
	newmod = strdup(modname);
Packit 9eaa09
	if (!newmod) {
Packit 9eaa09
		log(TO_CONSOLE, LOG_WARNING, "No memory to ban module %s\n", modname);
Packit 9eaa09
		return;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	*modlist = g_list_append(*modlist, newmod);
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
void add_cl_banned_module(char *modname)
Packit 9eaa09
{
Packit 9eaa09
	add_banned_module(modname, &cl_banned_modules);
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
			
Packit 9eaa09
/*
Packit 9eaa09
 * Inserts an irq_info struct into the intterupts_db list
Packit 9eaa09
 * devpath points to the device directory in sysfs for the 
Packit 9eaa09
 * related device. NULL devpath means no sysfs entries for
Packit 9eaa09
 * this irq.
Packit 9eaa09
 */
Packit 9eaa09
static struct irq_info *add_one_irq_to_db(const char *devpath, int irq, struct user_irq_policy *pol)
Packit 9eaa09
{
Packit 9eaa09
	int irq_class = IRQ_OTHER;
Packit 9eaa09
	struct irq_info *new, find;
Packit 9eaa09
	int numa_node;
Packit 9eaa09
	char path[PATH_MAX];
Packit 9eaa09
	FILE *fd;
Packit 9eaa09
	char *lcpu_mask;
Packit 9eaa09
	GList *entry;
Packit 9eaa09
	ssize_t ret;
Packit 9eaa09
	size_t blen;
Packit 9eaa09
Packit 9eaa09
	/*
Packit 9eaa09
	 * First check to make sure this isn't a duplicate entry
Packit 9eaa09
	 */
Packit 9eaa09
	find.irq = irq;
Packit 9eaa09
	entry = g_list_find_custom(interrupts_db, &find, compare_ints);
Packit 9eaa09
	if (entry) {
Packit 9eaa09
		log(TO_CONSOLE, LOG_INFO, "DROPPING DUPLICATE ENTRY FOR IRQ %d on path %s\n", irq, devpath);
Packit 9eaa09
		return NULL;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	if (is_banned_irq(irq)) {
Packit 9eaa09
		log(TO_ALL, LOG_INFO, "SKIPPING BANNED IRQ %d\n", irq);
Packit 9eaa09
		return NULL;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	new = calloc(sizeof(struct irq_info), 1);
Packit 9eaa09
	if (!new)
Packit 9eaa09
		return NULL;
Packit 9eaa09
Packit 9eaa09
	new->irq = irq;
Packit 9eaa09
	new->class = IRQ_OTHER;
Packit 9eaa09
Packit 9eaa09
	interrupts_db = g_list_append(interrupts_db, new);
Packit 9eaa09
Packit 9eaa09
 	/* Some special irqs have NULL devpath */
Packit 9eaa09
	if (devpath != NULL) {
Packit 9eaa09
		/* Map PCI class code to irq class */
Packit 9eaa09
		irq_class = get_irq_class(devpath);
Packit 9eaa09
		if (irq_class < 0)
Packit 9eaa09
			goto get_numa_node;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	new->class = irq_class;
Packit 9eaa09
	if (pol->level >= 0)
Packit 9eaa09
		new->level = pol->level;
Packit 9eaa09
	else
Packit 9eaa09
		new->level = map_class_to_level[irq_class];
Packit 9eaa09
Packit 9eaa09
get_numa_node:
Packit 9eaa09
	numa_node = -1;
Packit 9eaa09
	if (numa_avail) {
Packit 9eaa09
		sprintf(path, "%s/numa_node", devpath);
Packit 9eaa09
		fd = fopen(path, "r");
Packit 9eaa09
		if (fd) {
Packit 9eaa09
			fscanf(fd, "%d", &numa_node);
Packit 9eaa09
			fclose(fd);
Packit 9eaa09
		}
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	if (pol->numa_node_set == 1)
Packit 9eaa09
		new->numa_node = get_numa_node(pol->numa_node);
Packit 9eaa09
	else
Packit 9eaa09
		new->numa_node = get_numa_node(numa_node);
Packit 9eaa09
Packit 9eaa09
	sprintf(path, "%s/local_cpus", devpath);
Packit 9eaa09
	fd = fopen(path, "r");
Packit 9eaa09
	if (!fd) {
Packit 9eaa09
		cpus_setall(new->cpumask);
Packit 9eaa09
		goto out;
Packit 9eaa09
	}
Packit 9eaa09
	lcpu_mask = NULL;
Packit 9eaa09
	ret = getline(&lcpu_mask, &blen, fd);
Packit 9eaa09
	fclose(fd);
Packit 9eaa09
	if (ret <= 0) {
Packit 9eaa09
		cpus_setall(new->cpumask);
Packit 9eaa09
	} else {
Packit 9eaa09
		cpumask_parse_user(lcpu_mask, ret, new->cpumask);
Packit 9eaa09
	}
Packit 9eaa09
	free(lcpu_mask);
Packit 9eaa09
Packit 9eaa09
out:
Packit 9eaa09
	log(TO_CONSOLE, LOG_INFO, "Adding IRQ %d to database\n", irq);
Packit 9eaa09
	return new;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
static void parse_user_policy_key(char *buf, int irq, struct user_irq_policy *pol)
Packit 9eaa09
{
Packit 9eaa09
	char *key, *value, *end;
Packit 9eaa09
	char *levelvals[] = { "none", "package", "cache", "core" };
Packit 9eaa09
	int idx;
Packit 9eaa09
	int key_set = 1;
Packit 9eaa09
Packit 9eaa09
	key = buf;
Packit 9eaa09
	value = strchr(buf, '=');
Packit 9eaa09
Packit 9eaa09
	if (!value) {
Packit 9eaa09
		log(TO_SYSLOG, LOG_WARNING, "Bad format for policy, ignoring: %s\n", buf);
Packit 9eaa09
		return;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	/* NULL terminate the key and advance value to the start of the value
Packit 9eaa09
	 * string
Packit 9eaa09
	 */
Packit 9eaa09
	*value = '\0';
Packit 9eaa09
	value++;
Packit 9eaa09
	end = strchr(value, '\n');
Packit 9eaa09
	if (end)
Packit 9eaa09
		*end = '\0';
Packit 9eaa09
Packit 9eaa09
	if (!strcasecmp("ban", key)) {
Packit 9eaa09
		if (!strcasecmp("false", value))
Packit 9eaa09
			pol->ban = 0;
Packit 9eaa09
		else if (!strcasecmp("true", value))
Packit 9eaa09
			pol->ban = 1;
Packit 9eaa09
		else {
Packit 9eaa09
			key_set = 0;
Packit 9eaa09
			log(TO_ALL, LOG_WARNING, "Unknown value for ban policy: %s\n", value);
Packit 9eaa09
		}
Packit 9eaa09
	} else if (!strcasecmp("balance_level", key)) {
Packit 9eaa09
		for (idx=0; idx<4; idx++) {
Packit 9eaa09
			if (!strcasecmp(levelvals[idx], value))
Packit 9eaa09
				break;
Packit 9eaa09
		}
Packit 9eaa09
Packit 9eaa09
		if (idx>3) {
Packit 9eaa09
			key_set = 0;
Packit 9eaa09
			log(TO_ALL, LOG_WARNING, "Bad value for balance_level policy: %s\n", value);
Packit 9eaa09
		} else
Packit 9eaa09
			pol->level = idx;
Packit 9eaa09
	} else if (!strcasecmp("numa_node", key)) {
Packit 9eaa09
		idx = strtoul(value, NULL, 10);	
Packit 9eaa09
		if (!get_numa_node(idx)) {
Packit 9eaa09
			log(TO_ALL, LOG_WARNING, "NUMA node %d doesn't exist\n",
Packit 9eaa09
				idx);
Packit 9eaa09
			return;
Packit 9eaa09
		}
Packit 9eaa09
		pol->numa_node = idx;
Packit 9eaa09
		pol->numa_node_set = 1;
Packit 9eaa09
	} else {
Packit 9eaa09
		key_set = 0;
Packit 9eaa09
		log(TO_ALL, LOG_WARNING, "Unknown key returned, ignoring: %s\n", key);
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	if (key_set)
Packit 9eaa09
		log(TO_ALL, LOG_INFO, "IRQ %d: Override %s to %s\n", irq, key, value);
Packit 9eaa09
Packit 9eaa09
	
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
/*
Packit 9eaa09
 * Calls out to a possibly user defined script to get user assigned policy
Packit 9eaa09
 * aspects for a given irq.  A value of -1 in a given field indicates no
Packit 9eaa09
 * policy was given and that system defaults should be used
Packit 9eaa09
 */
Packit 9eaa09
static void get_irq_user_policy(char *path, int irq, struct user_irq_policy *pol)
Packit 9eaa09
{
Packit 9eaa09
	char *cmd;
Packit 9eaa09
	FILE *output;
Packit 9eaa09
	char buffer[128];
Packit 9eaa09
	char *brc;
Packit 9eaa09
Packit 9eaa09
	memset(pol, -1, sizeof(struct user_irq_policy));
Packit 9eaa09
Packit 9eaa09
	/* Return defaults if no script was given */
Packit 9eaa09
	if (!polscript)
Packit 9eaa09
		return;
Packit 9eaa09
Packit 9eaa09
	/* Use SYSFS_DIR for irq has no sysfs entries */
Packit 9eaa09
	if (!path)
Packit 9eaa09
		path = SYSFS_DIR;
Packit 9eaa09
Packit 9eaa09
	cmd = alloca(strlen(path)+strlen(polscript)+64);
Packit 9eaa09
	if (!cmd)
Packit 9eaa09
		return;
Packit 9eaa09
Packit 9eaa09
	sprintf(cmd, "exec %s %s %d", polscript, path, irq);
Packit 9eaa09
	output = popen(cmd, "r");
Packit 9eaa09
	if (!output) {
Packit 9eaa09
		log(TO_ALL, LOG_WARNING, "Unable to execute user policy script %s\n", polscript);
Packit 9eaa09
		return;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	while(!feof(output)) {
Packit 9eaa09
		brc = fgets(buffer, 128, output);
Packit 9eaa09
		if (brc)
Packit 9eaa09
			parse_user_policy_key(brc, irq, pol);
Packit 9eaa09
	}
Packit 9eaa09
	pclose(output);
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
static int check_for_module_ban(char *name)
Packit 9eaa09
{
Packit 9eaa09
	GList *entry;
Packit 9eaa09
Packit 9eaa09
	entry = g_list_find_custom(cl_banned_modules, name, substr_find);
Packit 9eaa09
Packit 9eaa09
	if (entry)
Packit 9eaa09
		return 1;
Packit 9eaa09
	else
Packit 9eaa09
		return 0;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
static int check_for_irq_ban(char *path __attribute__((unused)), int irq, GList *proc_interrupts)
Packit 9eaa09
{
Packit 9eaa09
	struct irq_info find, *res;
Packit 9eaa09
	GList *entry;
Packit 9eaa09
Packit 9eaa09
	/*
Packit 9eaa09
	 * Check to see if we banned this irq on the command line
Packit 9eaa09
	 */
Packit 9eaa09
	find.irq = irq;
Packit 9eaa09
	entry = g_list_find_custom(cl_banned_irqs, &find, compare_ints);
Packit 9eaa09
	if (entry)
Packit 9eaa09
		return 1;
Packit 9eaa09
Packit 9eaa09
	/*
Packit 9eaa09
	 * Check to see if we banned module which the irq belongs to.
Packit 9eaa09
	 */
Packit 9eaa09
	entry = g_list_find_custom(proc_interrupts, &find, compare_ints);
Packit 9eaa09
	if (entry) {
Packit 9eaa09
		res = entry->data;
Packit 9eaa09
		if (check_for_module_ban(res->name))
Packit 9eaa09
			return 1;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
#ifdef INCLUDE_BANSCRIPT
Packit 9eaa09
	char *cmd;
Packit 9eaa09
	int rc;
Packit 9eaa09
Packit 9eaa09
	if (!banscript)
Packit 9eaa09
		return 0;
Packit 9eaa09
Packit 9eaa09
	if (!path)
Packit 9eaa09
		return 0;
Packit 9eaa09
Packit 9eaa09
	cmd = alloca(strlen(path)+strlen(banscript)+32);
Packit 9eaa09
	if (!cmd)
Packit 9eaa09
		return 0;
Packit 9eaa09
	
Packit 9eaa09
	sprintf(cmd, "%s %s %d > /dev/null",banscript, path, irq);
Packit 9eaa09
	rc = system(cmd);
Packit 9eaa09
Packit 9eaa09
	/*
Packit 9eaa09
 	 * The system command itself failed
Packit 9eaa09
 	 */
Packit 9eaa09
	if (rc == -1) {
Packit 9eaa09
		log(TO_ALL, LOG_WARNING, "%s failed, please check the --banscript option\n", cmd);
Packit 9eaa09
		return 0;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	if (WEXITSTATUS(rc)) {
Packit 9eaa09
		log(TO_ALL, LOG_INFO, "irq %d is baned by %s\n", irq, banscript);
Packit 9eaa09
		return 1;
Packit 9eaa09
	}
Packit 9eaa09
#endif
Packit 9eaa09
	return 0;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
/*
Packit 9eaa09
 * Figures out which interrupt(s) relate to the device we"re looking at in dirname
Packit 9eaa09
 */
Packit 9eaa09
static void build_one_dev_entry(const char *dirname, GList *tmp_irqs)
Packit 9eaa09
{
Packit 9eaa09
	struct dirent *entry;
Packit 9eaa09
	DIR *msidir;
Packit 9eaa09
	FILE *fd;
Packit 9eaa09
	int irqnum;
Packit 9eaa09
	struct irq_info *new;
Packit 9eaa09
	char path[PATH_MAX];
Packit 9eaa09
	char devpath[PATH_MAX];
Packit 9eaa09
	struct user_irq_policy pol;
Packit 9eaa09
Packit 9eaa09
	sprintf(path, "%s/%s/msi_irqs", SYSDEV_DIR, dirname);
Packit 9eaa09
	sprintf(devpath, "%s/%s", SYSDEV_DIR, dirname);
Packit 9eaa09
	
Packit 9eaa09
	msidir = opendir(path);
Packit 9eaa09
Packit 9eaa09
	if (msidir) {
Packit 9eaa09
		do {
Packit 9eaa09
			entry = readdir(msidir);
Packit 9eaa09
			if (!entry)
Packit 9eaa09
				break;
Packit 9eaa09
			irqnum = strtol(entry->d_name, NULL, 10);
Packit 9eaa09
			if (irqnum) {
Packit 9eaa09
				new = get_irq_info(irqnum);
Packit 9eaa09
				if (new)
Packit 9eaa09
					continue;
Packit 9eaa09
				get_irq_user_policy(devpath, irqnum, &pol;;
Packit 9eaa09
				if ((pol.ban == 1) || (check_for_irq_ban(devpath, irqnum, tmp_irqs))) {
Packit 9eaa09
					add_banned_irq(irqnum, &banned_irqs);
Packit 9eaa09
					continue;
Packit 9eaa09
				}
Packit 9eaa09
				new = add_one_irq_to_db(devpath, irqnum, &pol;;
Packit 9eaa09
				if (!new)
Packit 9eaa09
					continue;
Packit 9eaa09
				new->type = IRQ_TYPE_MSIX;
Packit 9eaa09
			}
Packit 9eaa09
		} while (entry != NULL);
Packit 9eaa09
		closedir(msidir);
Packit 9eaa09
		return;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	sprintf(path, "%s/%s/irq", SYSDEV_DIR, dirname);
Packit 9eaa09
	fd = fopen(path, "r");
Packit 9eaa09
	if (!fd)
Packit 9eaa09
		return;
Packit 9eaa09
	if (fscanf(fd, "%d", &irqnum) < 0)
Packit 9eaa09
		goto done;
Packit 9eaa09
Packit 9eaa09
	/*
Packit 9eaa09
	 * no pci device has irq 0
Packit 9eaa09
	 * irq 255 is invalid on x86/x64 architectures
Packit 9eaa09
	 */
Packit 9eaa09
#if defined(__i386__) || defined(__x86_64__)
Packit 9eaa09
	if (irqnum && irqnum != 255) {
Packit 9eaa09
#else
Packit 9eaa09
	if (irqnum) {
Packit 9eaa09
#endif
Packit 9eaa09
		new = get_irq_info(irqnum);
Packit 9eaa09
		if (new)
Packit 9eaa09
			goto done;
Packit 9eaa09
		get_irq_user_policy(devpath, irqnum, &pol;;
Packit 9eaa09
		if ((pol.ban == 1) || (check_for_irq_ban(path, irqnum, tmp_irqs))) {
Packit 9eaa09
			add_banned_irq(irqnum, &banned_irqs);
Packit 9eaa09
			goto done;
Packit 9eaa09
		}
Packit 9eaa09
Packit 9eaa09
		new = add_one_irq_to_db(devpath, irqnum, &pol;;
Packit 9eaa09
		if (!new)
Packit 9eaa09
			goto done;
Packit 9eaa09
		new->type = IRQ_TYPE_LEGACY;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
done:
Packit 9eaa09
	fclose(fd);
Packit 9eaa09
	return;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
static void free_irq(struct irq_info *info, void *data __attribute__((unused)))
Packit 9eaa09
{
Packit 9eaa09
	free(info);
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
void free_irq_db(void)
Packit 9eaa09
{
Packit 9eaa09
	for_each_irq(NULL, free_irq, NULL);
Packit 9eaa09
	g_list_free(interrupts_db);
Packit 9eaa09
	interrupts_db = NULL;
Packit 9eaa09
	for_each_irq(banned_irqs, free_irq, NULL);
Packit 9eaa09
	g_list_free(banned_irqs);
Packit 9eaa09
	banned_irqs = NULL;
Packit 9eaa09
	g_list_free(rebalance_irq_list);
Packit 9eaa09
	rebalance_irq_list = NULL;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
void free_cl_opts(void)
Packit 9eaa09
{
Packit 9eaa09
	g_list_free_full(cl_banned_modules, free);
Packit 9eaa09
	g_list_free_full(cl_banned_irqs, free);
Packit 9eaa09
	g_list_free(banned_irqs);
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
static void add_new_irq(int irq, struct irq_info *hint, GList *proc_interrupts)
Packit 9eaa09
{
Packit 9eaa09
	struct irq_info *new;
Packit 9eaa09
	struct user_irq_policy pol;
Packit 9eaa09
Packit 9eaa09
	new = get_irq_info(irq);
Packit 9eaa09
	if (new)
Packit 9eaa09
		return;
Packit 9eaa09
Packit 9eaa09
	/* Set NULL devpath for the irq has no sysfs entries */
Packit 9eaa09
	get_irq_user_policy(NULL, irq, &pol;;
Packit 9eaa09
	if ((pol.ban == 1) || check_for_irq_ban(NULL, irq, proc_interrupts)) { /*FIXME*/
Packit 9eaa09
		add_banned_irq(irq, &banned_irqs);
Packit 9eaa09
		new = get_irq_info(irq);
Packit 9eaa09
	} else
Packit 9eaa09
		new = add_one_irq_to_db(NULL, irq, &pol;;
Packit 9eaa09
Packit 9eaa09
	if (!new) {
Packit 9eaa09
		log(TO_CONSOLE, LOG_WARNING, "add_new_irq: Failed to add irq %d\n", irq);
Packit 9eaa09
		return;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	/*
Packit 9eaa09
	 * Override some of the new irq defaults here
Packit 9eaa09
	 */
Packit 9eaa09
	if (hint) {
Packit 9eaa09
		new->type = hint->type;
Packit 9eaa09
		new->class = hint->class;
Packit 9eaa09
	}
Packit 9eaa09
Packit 9eaa09
	new->level = map_class_to_level[new->class];
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
static void add_missing_irq(struct irq_info *info, void *attr)
Packit 9eaa09
{
Packit 9eaa09
	struct irq_info *lookup = get_irq_info(info->irq);
Packit 9eaa09
	GList *proc_interrupts = (GList *) attr;
Packit 9eaa09
Packit 9eaa09
	if (!lookup)
Packit 9eaa09
		add_new_irq(info->irq, info, proc_interrupts);
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
Packit 9eaa09
void rebuild_irq_db(void)
Packit 9eaa09
{
Packit 9eaa09
	DIR *devdir;
Packit 9eaa09
	struct dirent *entry;
Packit 9eaa09
	GList *tmp_irqs = NULL;
Packit 9eaa09
Packit 9eaa09
	free_irq_db();
Packit 9eaa09
Packit 9eaa09
	tmp_irqs = collect_full_irq_list();
Packit 9eaa09
Packit 9eaa09
	devdir = opendir(SYSDEV_DIR);
Packit 9eaa09
	if (!devdir)
Packit 9eaa09
		goto free;
Packit 9eaa09
Packit 9eaa09
	do {
Packit 9eaa09
		entry = readdir(devdir);
Packit 9eaa09
Packit 9eaa09
		if (!entry)
Packit 9eaa09
			break;
Packit 9eaa09
Packit 9eaa09
		build_one_dev_entry(entry->d_name, tmp_irqs);
Packit 9eaa09
Packit 9eaa09
	} while (entry != NULL);
Packit 9eaa09
Packit 9eaa09
	closedir(devdir);
Packit 9eaa09
Packit 9eaa09
Packit 9eaa09
	for_each_irq(tmp_irqs, add_missing_irq, interrupts_db);
Packit 9eaa09
Packit 9eaa09
free:
Packit 9eaa09
	g_list_free_full(tmp_irqs, free);
Packit 9eaa09
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
void for_each_irq(GList *list, void (*cb)(struct irq_info *info, void *data), void *data)
Packit 9eaa09
{
Packit 9eaa09
	GList *entry = g_list_first(list ? list : interrupts_db);
Packit 9eaa09
	GList *next;
Packit 9eaa09
Packit 9eaa09
	while (entry) {
Packit 9eaa09
		next = g_list_next(entry);
Packit 9eaa09
		cb(entry->data, data);
Packit 9eaa09
		entry = next;
Packit 9eaa09
	}
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
struct irq_info *get_irq_info(int irq)
Packit 9eaa09
{
Packit 9eaa09
	GList *entry;
Packit 9eaa09
	struct irq_info find;
Packit 9eaa09
Packit 9eaa09
	find.irq = irq;
Packit 9eaa09
	entry = g_list_find_custom(interrupts_db, &find, compare_ints);
Packit 9eaa09
Packit 9eaa09
	if (!entry)
Packit 9eaa09
		entry = g_list_find_custom(banned_irqs, &find, compare_ints);
Packit 9eaa09
Packit 9eaa09
	return entry ? entry->data : NULL;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
void migrate_irq(GList **from, GList **to, struct irq_info *info)
Packit 9eaa09
{
Packit 9eaa09
	GList *entry;
Packit 9eaa09
	struct irq_info find, *tmp;
Packit 9eaa09
Packit 9eaa09
	find.irq = info->irq;
Packit 9eaa09
	entry = g_list_find_custom(*from, &find, compare_ints);
Packit 9eaa09
Packit 9eaa09
	if (!entry)
Packit 9eaa09
		return;
Packit 9eaa09
Packit 9eaa09
	tmp = entry->data;
Packit 9eaa09
	*from = g_list_delete_link(*from, entry);
Packit 9eaa09
Packit 9eaa09
Packit 9eaa09
	*to = g_list_append(*to, tmp);
Packit 9eaa09
	info->moved = 1;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
static gint sort_irqs(gconstpointer A, gconstpointer B)
Packit 9eaa09
{
Packit 9eaa09
        struct irq_info *a, *b;
Packit 9eaa09
        
Packit 9eaa09
        a = (struct irq_info*)A;
Packit 9eaa09
        b = (struct irq_info*)B;
Packit 9eaa09
Packit 9eaa09
	if (a->class < b->class)
Packit 9eaa09
		return 1;
Packit 9eaa09
	if (a->class > b->class)
Packit 9eaa09
		return -1;
Packit 9eaa09
	if (a->load < b->load)
Packit 9eaa09
		return 1;
Packit 9eaa09
	if (a->load > b->load)
Packit 9eaa09
		return -1;
Packit 9eaa09
	if (a < b)
Packit 9eaa09
		return 1;
Packit 9eaa09
        return -1;
Packit 9eaa09
}
Packit 9eaa09
Packit 9eaa09
void sort_irq_list(GList **list)
Packit 9eaa09
{
Packit 9eaa09
	*list = g_list_sort(*list, sort_irqs);
Packit 9eaa09
}