ARC: smp: Move default boot kick/wait code out of MCIP into common code
[firefly-linux-kernel-4.4.55.git] / arch / arc / kernel / mcip.c
1 /*
2  * ARC ARConnect (MultiCore IP) support (formerly known as MCIP)
3  *
4  * Copyright (C) 2013 Synopsys, Inc. (www.synopsys.com)
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 as
8  * published by the Free Software Foundation.
9  */
10
11 #include <linux/smp.h>
12 #include <linux/irq.h>
13 #include <linux/spinlock.h>
14 #include <asm/mcip.h>
15 #include <asm/setup.h>
16
17 static char smp_cpuinfo_buf[128];
18 static int idu_detected;
19
20 static DEFINE_RAW_SPINLOCK(mcip_lock);
21
22 /*
23  * Any SMP specific init any CPU does when it comes up.
24  * Here we setup the CPU to enable Inter-Processor-Interrupts
25  * Called for each CPU
26  * -Master      : init_IRQ()
27  * -Other(s)    : start_kernel_secondary()
28  */
29 void mcip_init_smp(unsigned int cpu)
30 {
31         smp_ipi_irq_setup(cpu, IPI_IRQ);
32 }
33
34 static void mcip_ipi_send(int cpu)
35 {
36         unsigned long flags;
37         int ipi_was_pending;
38
39         /*
40          * NOTE: We must spin here if the other cpu hasn't yet
41          * serviced a previous message. This can burn lots
42          * of time, but we MUST follows this protocol or
43          * ipi messages can be lost!!!
44          * Also, we must release the lock in this loop because
45          * the other side may get to this same loop and not
46          * be able to ack -- thus causing deadlock.
47          */
48
49         do {
50                 raw_spin_lock_irqsave(&mcip_lock, flags);
51                 __mcip_cmd(CMD_INTRPT_READ_STATUS, cpu);
52                 ipi_was_pending = read_aux_reg(ARC_REG_MCIP_READBACK);
53                 if (ipi_was_pending == 0)
54                         break; /* break out but keep lock */
55                 raw_spin_unlock_irqrestore(&mcip_lock, flags);
56         } while (1);
57
58         __mcip_cmd(CMD_INTRPT_GENERATE_IRQ, cpu);
59         raw_spin_unlock_irqrestore(&mcip_lock, flags);
60
61 #ifdef CONFIG_ARC_IPI_DBG
62         if (ipi_was_pending)
63                 pr_info("IPI ACK delayed from cpu %d\n", cpu);
64 #endif
65 }
66
67 static void mcip_ipi_clear(int irq)
68 {
69         unsigned int cpu, c;
70         unsigned long flags;
71         unsigned int __maybe_unused copy;
72
73         raw_spin_lock_irqsave(&mcip_lock, flags);
74
75         /* Who sent the IPI */
76         __mcip_cmd(CMD_INTRPT_CHECK_SOURCE, 0);
77
78         copy = cpu = read_aux_reg(ARC_REG_MCIP_READBACK);       /* 1,2,4,8... */
79
80         /*
81          * In rare case, multiple concurrent IPIs sent to same target can
82          * possibly be coalesced by MCIP into 1 asserted IRQ, so @cpus can be
83          * "vectored" (multiple bits sets) as opposed to typical single bit
84          */
85         do {
86                 c = __ffs(cpu);                 /* 0,1,2,3 */
87                 __mcip_cmd(CMD_INTRPT_GENERATE_ACK, c);
88                 cpu &= ~(1U << c);
89         } while (cpu);
90
91         raw_spin_unlock_irqrestore(&mcip_lock, flags);
92
93 #ifdef CONFIG_ARC_IPI_DBG
94         if (c != __ffs(copy))
95                 pr_info("IPIs from %x coalesced to %x\n",
96                         copy, raw_smp_processor_id());
97 #endif
98 }
99
100 struct plat_smp_ops plat_smp_ops = {
101         .info           = smp_cpuinfo_buf,
102         .ipi_send       = mcip_ipi_send,
103         .ipi_clear      = mcip_ipi_clear,
104 };
105
106 void mcip_init_early_smp(void)
107 {
108         struct mcip_bcr {
109 #ifdef CONFIG_CPU_BIG_ENDIAN
110                 unsigned int pad3:8,
111                              idu:1, llm:1, num_cores:6,
112                              iocoh:1,  grtc:1, dbg:1, pad2:1,
113                              msg:1, sem:1, ipi:1, pad:1,
114                              ver:8;
115 #else
116                 unsigned int ver:8,
117                              pad:1, ipi:1, sem:1, msg:1,
118                              pad2:1, dbg:1, grtc:1, iocoh:1,
119                              num_cores:6, llm:1, idu:1,
120                              pad3:8;
121 #endif
122         } mp;
123
124         READ_BCR(ARC_REG_MCIP_BCR, mp);
125
126         sprintf(smp_cpuinfo_buf,
127                 "Extn [SMP]\t: ARConnect (v%d): %d cores with %s%s%s%s\n",
128                 mp.ver, mp.num_cores,
129                 IS_AVAIL1(mp.ipi, "IPI "),
130                 IS_AVAIL1(mp.idu, "IDU "),
131                 IS_AVAIL1(mp.dbg, "DEBUG "),
132                 IS_AVAIL1(mp.grtc, "GRTC"));
133
134         idu_detected = mp.idu;
135
136         if (mp.dbg) {
137                 __mcip_cmd_data(CMD_DEBUG_SET_SELECT, 0, 0xf);
138                 __mcip_cmd_data(CMD_DEBUG_SET_MASK, 0xf, 0xf);
139         }
140
141         if (IS_ENABLED(CONFIG_ARC_HAS_GRTC) && !mp.grtc)
142                 panic("kernel trying to use non-existent GRTC\n");
143 }
144
145 /***************************************************************************
146  * ARCv2 Interrupt Distribution Unit (IDU)
147  *
148  * Connects external "COMMON" IRQs to core intc, providing:
149  *  -dynamic routing (IRQ affinity)
150  *  -load balancing (Round Robin interrupt distribution)
151  *  -1:N distribution
152  *
153  * It physically resides in the MCIP hw block
154  */
155
156 #include <linux/irqchip.h>
157 #include <linux/of.h>
158 #include <linux/of_irq.h>
159
160 /*
161  * Set the DEST for @cmn_irq to @cpu_mask (1 bit per core)
162  */
163 static void idu_set_dest(unsigned int cmn_irq, unsigned int cpu_mask)
164 {
165         __mcip_cmd_data(CMD_IDU_SET_DEST, cmn_irq, cpu_mask);
166 }
167
168 static void idu_set_mode(unsigned int cmn_irq, unsigned int lvl,
169                            unsigned int distr)
170 {
171         union {
172                 unsigned int word;
173                 struct {
174                         unsigned int distr:2, pad:2, lvl:1, pad2:27;
175                 };
176         } data;
177
178         data.distr = distr;
179         data.lvl = lvl;
180         __mcip_cmd_data(CMD_IDU_SET_MODE, cmn_irq, data.word);
181 }
182
183 static void idu_irq_mask(struct irq_data *data)
184 {
185         unsigned long flags;
186
187         raw_spin_lock_irqsave(&mcip_lock, flags);
188         __mcip_cmd_data(CMD_IDU_SET_MASK, data->hwirq, 1);
189         raw_spin_unlock_irqrestore(&mcip_lock, flags);
190 }
191
192 static void idu_irq_unmask(struct irq_data *data)
193 {
194         unsigned long flags;
195
196         raw_spin_lock_irqsave(&mcip_lock, flags);
197         __mcip_cmd_data(CMD_IDU_SET_MASK, data->hwirq, 0);
198         raw_spin_unlock_irqrestore(&mcip_lock, flags);
199 }
200
201 #ifdef CONFIG_SMP
202 static int
203 idu_irq_set_affinity(struct irq_data *data, const struct cpumask *cpumask,
204                      bool force)
205 {
206         unsigned long flags;
207         cpumask_t online;
208
209         /* errout if no online cpu per @cpumask */
210         if (!cpumask_and(&online, cpumask, cpu_online_mask))
211                 return -EINVAL;
212
213         raw_spin_lock_irqsave(&mcip_lock, flags);
214
215         idu_set_dest(data->hwirq, cpumask_bits(&online)[0]);
216         idu_set_mode(data->hwirq, IDU_M_TRIG_LEVEL, IDU_M_DISTRI_RR);
217
218         raw_spin_unlock_irqrestore(&mcip_lock, flags);
219
220         return IRQ_SET_MASK_OK;
221 }
222 #endif
223
224 static struct irq_chip idu_irq_chip = {
225         .name                   = "MCIP IDU Intc",
226         .irq_mask               = idu_irq_mask,
227         .irq_unmask             = idu_irq_unmask,
228 #ifdef CONFIG_SMP
229         .irq_set_affinity       = idu_irq_set_affinity,
230 #endif
231
232 };
233
234 static int idu_first_irq;
235
236 static void idu_cascade_isr(struct irq_desc *desc)
237 {
238         struct irq_domain *domain = irq_desc_get_handler_data(desc);
239         unsigned int core_irq = irq_desc_get_irq(desc);
240         unsigned int idu_irq;
241
242         idu_irq = core_irq - idu_first_irq;
243         generic_handle_irq(irq_find_mapping(domain, idu_irq));
244 }
245
246 static int idu_irq_map(struct irq_domain *d, unsigned int virq, irq_hw_number_t hwirq)
247 {
248         irq_set_chip_and_handler(virq, &idu_irq_chip, handle_level_irq);
249         irq_set_status_flags(virq, IRQ_MOVE_PCNTXT);
250
251         return 0;
252 }
253
254 static int idu_irq_xlate(struct irq_domain *d, struct device_node *n,
255                          const u32 *intspec, unsigned int intsize,
256                          irq_hw_number_t *out_hwirq, unsigned int *out_type)
257 {
258         irq_hw_number_t hwirq = *out_hwirq = intspec[0];
259         int distri = intspec[1];
260         unsigned long flags;
261
262         *out_type = IRQ_TYPE_NONE;
263
264         /* XXX: validate distribution scheme again online cpu mask */
265         if (distri == 0) {
266                 /* 0 - Round Robin to all cpus, otherwise 1 bit per core */
267                 raw_spin_lock_irqsave(&mcip_lock, flags);
268                 idu_set_dest(hwirq, BIT(num_online_cpus()) - 1);
269                 idu_set_mode(hwirq, IDU_M_TRIG_LEVEL, IDU_M_DISTRI_RR);
270                 raw_spin_unlock_irqrestore(&mcip_lock, flags);
271         } else {
272                 /*
273                  * DEST based distribution for Level Triggered intr can only
274                  * have 1 CPU, so generalize it to always contain 1 cpu
275                  */
276                 int cpu = ffs(distri);
277
278                 if (cpu != fls(distri))
279                         pr_warn("IDU irq %lx distri mode set to cpu %x\n",
280                                 hwirq, cpu);
281
282                 raw_spin_lock_irqsave(&mcip_lock, flags);
283                 idu_set_dest(hwirq, cpu);
284                 idu_set_mode(hwirq, IDU_M_TRIG_LEVEL, IDU_M_DISTRI_DEST);
285                 raw_spin_unlock_irqrestore(&mcip_lock, flags);
286         }
287
288         return 0;
289 }
290
291 static const struct irq_domain_ops idu_irq_ops = {
292         .xlate  = idu_irq_xlate,
293         .map    = idu_irq_map,
294 };
295
296 /*
297  * [16, 23]: Statically assigned always private-per-core (Timers, WDT, IPI)
298  * [24, 23+C]: If C > 0 then "C" common IRQs
299  * [24+C, N]: Not statically assigned, private-per-core
300  */
301
302
303 static int __init
304 idu_of_init(struct device_node *intc, struct device_node *parent)
305 {
306         struct irq_domain *domain;
307         /* Read IDU BCR to confirm nr_irqs */
308         int nr_irqs = of_irq_count(intc);
309         int i, irq;
310
311         if (!idu_detected)
312                 panic("IDU not detected, but DeviceTree using it");
313
314         pr_info("MCIP: IDU referenced from Devicetree %d irqs\n", nr_irqs);
315
316         domain = irq_domain_add_linear(intc, nr_irqs, &idu_irq_ops, NULL);
317
318         /* Parent interrupts (core-intc) are already mapped */
319
320         for (i = 0; i < nr_irqs; i++) {
321                 /*
322                  * Return parent uplink IRQs (towards core intc) 24,25,.....
323                  * this step has been done before already
324                  * however we need it to get the parent virq and set IDU handler
325                  * as first level isr
326                  */
327                 irq = irq_of_parse_and_map(intc, i);
328                 if (!i)
329                         idu_first_irq = irq;
330
331                 irq_set_chained_handler_and_data(irq, idu_cascade_isr, domain);
332         }
333
334         __mcip_cmd(CMD_IDU_ENABLE, 0);
335
336         return 0;
337 }
338 IRQCHIP_DECLARE(arcv2_idu_intc, "snps,archs-idu-intc", idu_of_init);