source: trunk/source/level-0/PPC/ppc-numbers.lisp @ 16085

Last change on this file since 16085 was 16085, checked in by gb, 5 years ago

First attempt to merge acode-rewrite branch into trunk.

  • Property svn:eol-style set to native
  • Property svn:keywords set to Author Date Id Revision
File size: 12.3 KB
Line 
1;-*- Mode: Lisp; Package: CCL -*-
2;;;
3;;;   Copyright (C) 2009 Clozure Associates
4;;;   Copyright (C) 1994-2001 Digitool, Inc
5;;;   This file is part of Clozure CL. 
6;;;
7;;;   Clozure CL is licensed under the terms of the Lisp Lesser GNU Public
8;;;   License , known as the LLGPL and distributed with Clozure CL as the
9;;;   file "LICENSE".  The LLGPL consists of a preamble and the LGPL,
10;;;   which is distributed with Clozure CL as the file "LGPL".  Where these
11;;;   conflict, the preamble takes precedence. 
12;;;
13;;;   Clozure CL is referenced in the preamble as the "LIBRARY."
14;;;
15;;;   The LLGPL is also available online at
16;;;   http://opensource.franz.com/preamble.html
17
18
19
20(in-package "CCL")
21
22(defppclapfunction %fixnum-signum ((number arg_z))
23  (cmpri :cr0 number '0)
24  (li arg_z '0)
25  (beqlr :cr0)
26  (li arg_z '1)               ; assume positive
27  (bgtlr :cr0)
28  (li arg_z '-1)
29  (blr))
30
31; see %logcount (ppc-bignum.lisp)
32(defppclapfunction %ilogcount ((number arg_z))
33  (let ((arg imm0)
34        (shift imm1)
35        (temp imm2))
36    (unbox-fixnum arg number)
37    (mr. shift arg)
38    (li arg_z 0)
39    (b @test)
40    @next
41    (la temp -1 shift)
42    (and. shift shift temp)
43    (la arg_z '1 arg_z)
44    @test
45    (bne @next)
46    (blr)))
47
48(defppclapfunction %iash ((number arg_y) (count arg_z))
49  (unbox-fixnum imm1 count)
50  (unbox-fixnum imm0 number)
51  (neg. imm2 imm1)
52  (blt @left)
53  (srar imm0 imm0 imm2)
54  (box-fixnum arg_z imm0)
55  (blr)
56  @left
57  (slr arg_z number imm1)
58  (blr))
59
60(defparameter *double-float-zero* 0.0d0)
61(defparameter *short-float-zero* 0.0s0)
62
63
64#+ppc32-target
65(defppclapfunction %sfloat-hwords ((sfloat arg_z))
66  (lwz imm0 ppc32::single-float.value sfloat)
67  (digit-h temp0 imm0)
68  (digit-l temp1 imm0)
69  (vpush temp0)
70  (vpush temp1)
71  (la temp0 8 vsp)
72  (set-nargs 2)
73  (ba .SPvalues))
74
75
76; (integer-length arg) = (- 32 (cntlz (if (>= arg 0) arg (lognot arg))))
77#+ppc32-target
78(defppclapfunction %fixnum-intlen ((number arg_z)) 
79  (unbox-fixnum imm0 arg_z)
80  (cntlzw. imm1 imm0)                   ; testing result of cntlzw? - ah no zeros if neg
81  (bne @nonneg)
82  (not imm1 imm0)
83  (cntlzw imm1 imm1)
84  @nonneg
85  (subfic imm1 imm1 32)
86  (box-fixnum arg_z imm1)
87  (blr))
88
89#+ppc64-target
90(defppclapfunction %fixnum-intlen ((number arg_z)) 
91  (unbox-fixnum imm0 arg_z)
92  (cntlzd. imm1 imm0)
93  (bne @nonneg)
94  (not imm1 imm0)
95  (cntlzd imm1 imm1)
96  @nonneg
97  (subfic imm1 imm1 64)
98  (box-fixnum arg_z imm1)
99  (blr))
100
101
102
103
104;;; Caller guarantees that result fits in a fixnum.
105#+ppc32-target
106(defppclapfunction %truncate-double-float->fixnum ((arg arg_z))
107  (get-double-float fp0 arg)
108  (fctiwz fp0 fp0)
109  (stwu tsp -16 tsp)
110  (stw tsp 4 tsp)
111  (stfd fp0 8 tsp)
112  (lwz imm0 (+ 8 4) tsp)
113  (lwz tsp 0 tsp)
114  (box-fixnum arg_z imm0) 
115  (blr))
116
117#+ppc64-target
118(defppclapfunction %truncate-double-float->fixnum ((arg arg_z))
119  (get-double-float fp0 arg)
120  (fctidz fp0 fp0)
121  (stdu tsp -32 tsp)
122  (std tsp 8 tsp)
123  (stfd fp0 16 tsp)
124  (ld imm0 16 tsp)
125  (la tsp 32 tsp)
126  (box-fixnum arg_z imm0) 
127  (blr))
128
129#+ppc32-target
130(defppclapfunction %truncate-short-float->fixnum ((arg arg_z))
131  (get-single-float fp0 arg)
132  (fctiwz fp0 fp0)
133  (stwu tsp -16 tsp)
134  (stw tsp 4 tsp)
135  (stfd fp0 8 tsp)
136  (lwz imm0 (+ 8 4) tsp)
137  (lwz tsp 0 tsp)
138  (box-fixnum arg_z imm0) 
139  (blr))
140
141#+ppc64-target
142(defppclapfunction %truncate-short-float->fixnum ((arg arg_z))
143  (get-single-float fp0 arg)
144  (fctidz fp0 fp0)
145  (stdu tsp -32 tsp)
146  (std tsp 8 tsp)
147  (stfd fp0 16 tsp)
148  (ld imm0 16 tsp)
149  (la tsp 32 tsp)
150  (box-fixnum arg_z imm0) 
151  (blr))
152
153;;; DOES round to even
154#+ppc32-target
155(defppclapfunction %round-nearest-double-float->fixnum ((arg arg_z))
156  (get-double-float fp0 arg)
157  (fctiw fp0 fp0)
158  (stwu tsp -16 tsp)
159  (stw tsp 4 tsp)
160  (stfd fp0 8 tsp)
161  (lwz imm0 (+ 8 4) tsp)
162  (lwz tsp 0 tsp)
163  (box-fixnum arg_z imm0) 
164  (blr))
165
166#+ppc64-target
167(defppclapfunction %round-nearest-double-float->fixnum ((arg arg_z))
168  (get-double-float fp0 arg)
169  (fctid fp0 fp0)
170  (stdu tsp -32 tsp)
171  (std tsp 8 tsp)
172  (stfd fp0 16 tsp)
173  (ld imm0 16 tsp)
174  (la tsp 32 tsp)
175  (box-fixnum arg_z imm0) 
176  (blr))
177
178#+ppc32-target
179(defppclapfunction %round-nearest-short-float->fixnum ((arg arg_z))
180  (get-single-float fp0 arg)
181  (fctiw fp0 fp0)
182  (stwu tsp -16 tsp)
183  (stw tsp 4 tsp)
184  (stfd fp0 8 tsp)
185  (lwz imm0 (+ 8 4) tsp)
186  (lwz tsp 0 tsp)
187  (box-fixnum arg_z imm0) 
188  (blr))
189
190#+ppc64-target
191(defppclapfunction %round-nearest-short-float->fixnum ((arg arg_z))
192  (get-single-float fp0 arg)
193  (fctid fp0 fp0)
194  (stdu tsp -32 tsp)
195  (std tsp 8 tsp)
196  (stfd fp0 16 tsp)
197  (ld imm0 16 tsp)
198  (la tsp 32 tsp)
199  (box-fixnum arg_z imm0) 
200  (blr))
201
202
203
204
205;;; maybe this could be smarter but frankly scarlett I dont give a damn
206;;; ticket:666 describes one reason to give a damn.
207#+ppc32-target
208(defppclapfunction %fixnum-truncate ((dividend arg_y) (divisor arg_z))
209  (let ((unboxed-quotient imm0)
210        (unboxed-dividend imm1)
211        (unboxed-divisor imm2)
212        (unboxed-product imm3)
213        (product temp0)
214        (boxed-quotient temp1)
215        (remainder temp2))
216    (cmpwi divisor '-1)   
217    (unbox-fixnum unboxed-dividend dividend)
218    (unbox-fixnum unboxed-divisor divisor)
219    (beq @neg)
220    (divwo. unboxed-quotient unboxed-dividend unboxed-divisor)          ; set OV if divisor = 0
221    (box-fixnum boxed-quotient unboxed-quotient)
222    (mullw unboxed-product unboxed-quotient unboxed-divisor)
223    (bns+ @ok)
224    (mtxer rzero)
225    (save-lisp-context)
226    (set-nargs 3)
227    (load-constant arg_x truncate)
228    (call-symbol divide-by-zero-error)
229    @not-0
230    @ok
231    (subf imm0 unboxed-product unboxed-dividend)
232    (vpush boxed-quotient)
233    (box-fixnum remainder imm0)
234    (vpush remainder)
235    (set-nargs 2)
236    (la temp0 8 vsp)
237    (ba .SPvalues)
238    @neg
239    (nego. dividend dividend)
240    (lwz arg_z '*least-positive-bignum* nfn)
241    (bns @ret)
242    (mtxer rzero)
243    (lwz dividend ppc32::symbol.vcell arg_z)
244    @ret
245    (mr temp0 vsp)
246    (vpush dividend)
247    (vpush rzero)
248    (set-nargs 2)
249    (ba .SPvalues)))
250
251#+ppc64-target
252(defppclapfunction %fixnum-truncate ((dividend arg_y) (divisor arg_z))
253  (let ((unboxed-quotient imm0)
254        (unboxed-dividend imm1)
255        (unboxed-divisor imm2)
256        (unboxed-product imm3)
257        (product temp0)
258        (boxed-quotient temp1)
259        (remainder temp2))
260    (cmpdi divisor '-1)
261    (unbox-fixnum unboxed-dividend dividend)
262    (unbox-fixnum unboxed-divisor divisor)
263    (beq @neg)
264    (divdo. unboxed-quotient unboxed-dividend unboxed-divisor)          ; set OV if divisor = 0
265    (box-fixnum boxed-quotient unboxed-quotient)
266    (mulld unboxed-product unboxed-quotient unboxed-divisor)
267    (bns+ @ok)
268    (mtxer rzero)
269    (save-lisp-context)
270    (set-nargs 3)
271    (load-constant arg_x truncate)
272    (call-symbol divide-by-zero-error)
273    @not-0
274    @ok
275    (subf imm0 unboxed-product unboxed-dividend)
276    (vpush boxed-quotient)
277    (box-fixnum remainder imm0)
278    (vpush remainder)
279    (set-nargs 2)
280    (la temp0 '2 vsp)
281    (ba .SPvalues)
282    @neg
283    (nego. dividend dividend)
284    (ld arg_z '*least-positive-bignum* nfn)
285    (bns @ret)
286    (mtxer rzero)
287    (ld dividend ppc64::symbol.vcell arg_z)
288    @ret
289    (mr temp0 vsp)
290    (vpush dividend)
291    (vpush rzero)
292    (set-nargs 2)
293    (ba .SPvalues)   
294    ))
295
296
297(defppclapfunction called-for-mv-p ()
298  (mr imm1 sp)
299  (ldr imm2 target::tcr.nfp target::rcontext)
300  (cmpr imm1 imm2)
301  (ref-global imm0 ret1valaddr)
302  (bne @notnfp)
303  (ldr imm1 0 imm1)
304  @notnfp
305  (ldr imm1 target::lisp-frame.savelr imm1)
306  (eq->boolean arg_z imm0 imm1 imm0)
307  (blr))
308
309;;; n1 and n2 must be positive (esp non zero)
310#+ppc32-target
311(defppclapfunction %fixnum-gcd ((n1 arg_y)(n2 arg_z))
312  (let ((temp imm0)
313        (u imm1)
314        (v imm2)
315        (ut0 imm3)
316        (vt0 imm4))
317    (unbox-fixnum u n1)
318    (unbox-fixnum v n2)
319    (neg temp u)
320    (and temp temp u)
321    (cntlzw ut0 temp)
322    (subfic ut0 ut0 31)
323    (neg temp v)
324    (and temp temp v)
325    (cntlzw vt0 temp)
326    (subfic vt0 vt0 31)
327    (cmpw cr2 ut0 vt0)
328    (srw u u ut0)
329    (srw v v vt0)
330    (addi ut0 ut0 ppc32::fixnum-shift)
331    (addi vt0 vt0 ppc32::fixnum-shift)
332    @loop
333    (cmpw cr0 u v)
334    (slw arg_z u ut0)
335    (bgt cr0 @u>v)
336    (blt cr0 @u<v)
337    (blelr cr2)
338    (slw arg_z u vt0)
339    (blr)
340    @u>v
341    (sub u u v)
342    @shiftu
343    (andi. temp u (ash 1 1))
344    (srwi u u 1)
345    (beq cr0 @shiftu)
346    (b @loop)
347    @u<v
348    (sub v v u)
349    @shiftv
350    (andi. temp v (ash 1 1))
351    (srwi v v 1)
352    (beq cr0 @shiftv)
353    (b @loop)))
354
355#+ppc64-target
356(defppclapfunction %fixnum-gcd ((n1 arg_y)(n2 arg_z))
357  (let ((temp imm0)
358        (u imm1)
359        (v imm2)
360        (ut0 imm3)
361        (vt0 imm4))
362    (unbox-fixnum u n1)
363    (unbox-fixnum v n2)
364    (neg temp u)
365    (and temp temp u)
366    (cntlzd ut0 temp)
367    (subfic ut0 ut0 63)
368    (neg temp v)
369    (and temp temp v)
370    (cntlzd vt0 temp)
371    (subfic vt0 vt0 63)
372    (cmpw cr2 ut0 vt0)
373    (srd u u ut0)
374    (srd v v vt0)
375    (addi ut0 ut0 ppc64::fixnum-shift)
376    (addi vt0 vt0 ppc64::fixnum-shift)
377    @loop
378    (cmpd cr0 u v)
379    (sld arg_z u ut0)
380    (bgt cr0 @u>v)
381    (blt cr0 @u<v)
382    (blelr cr2)
383    (sld arg_z u vt0)
384    (blr)
385    @u>v
386    (sub u u v)
387    @shiftu
388    (andi. temp u (ash 1 1))
389    (srdi u u 1)
390    (beq cr0 @shiftu)
391    (b @loop)
392    @u<v
393    (sub v v u)
394    @shiftv
395    (andi. temp v (ash 1 1))
396    (srdi v v 1)
397    (beq cr0 @shiftv)
398    (b @loop)))
399
400(defppclapfunction %mrg31k3p ((state arg_z))
401  (let ((seed temp0))
402    (svref seed 1 state)
403    (u32-ref imm0 1 seed)
404    (u32-ref imm3 2 seed)
405    (rlwinm imm1 imm0 22 1 9)
406    (srwi imm2 imm0 9)
407    (add imm0 imm1 imm2)
408   
409    ;; construct m1 (1- (expt 2 31))
410    (lis imm1 #x7fff)
411    (ori imm1 imm1 #xffff)
412
413    (rlwinm imm4 imm3 7 1 24)
414    (srwi imm5 imm3 24)
415    (add imm0 imm0 imm4)
416    (add imm0 imm0 imm5)
417
418    ;; reduce mod m1
419    (cmplw cr7 imm0 imm1)
420    (blt cr7 @ok1)
421    (sub imm0 imm0 imm1)
422    @ok1
423
424    (add imm0 imm0 imm3)
425
426    ;; reduce mod m1
427    (cmplw cr7 imm0 imm1)
428    (blt cr7 @ok2)
429    (sub imm0 imm0 imm1)
430    @ok2
431
432    ;; update state
433    (u32-ref imm1 1 seed)
434    (u32-set imm1 2 seed)
435    (u32-ref imm1 0 seed)
436    (u32-set imm1 1 seed)
437    (u32-set imm0 0 seed)
438
439    ;; construct m2 (- (expt 2 31) 21069))
440    (lis imm5 #x7fff)
441    (ori imm5 imm5 44467)
442
443    ;; second component
444    (u32-ref imm0 3 seed)
445    (rlwinm imm1 imm0 15 1 16)
446    (srwi imm2 imm0 16)
447    (mulli imm2 imm2 21069)
448    (add imm0 imm1 imm2)
449
450    ;; reduce mod m2
451    (cmplw cr7 imm0 imm5)
452    (blt cr7 @ok3)
453    (sub imm0 imm0 imm5)
454    @ok3
455
456    (u32-ref imm1 5 seed)
457    (rlwinm imm2 imm1 15 1 16)
458    (srwi imm3 imm1 16)
459    (mulli imm3 imm3 21069)
460    (add imm2 imm2 imm3)
461
462    ;; reduce mod m2
463    (cmplw cr7 imm2 imm5)
464    (blt cr7 @ok4)
465    (sub imm2 imm2 imm5)
466    @ok4
467
468    (add imm2 imm1 imm2)
469    (cmplw cr7 imm2 imm5)
470    (blt cr7 @ok5)
471    (sub imm2 imm2 imm5)
472    @ok5
473
474    (add imm2 imm2 imm0)
475    (cmplw cr7 imm2 imm5)
476    (blt cr7 @ok6)
477    (sub imm2 imm2 imm5)
478    @ok6
479
480    ;; update state
481    (u32-ref imm0 4 seed)
482    (u32-set imm0 5 seed)
483    (u32-ref imm0 3 seed)
484    (u32-set imm0 4 seed)
485    (u32-set imm2 3 seed)
486
487    ;; construct m1 (1- (expt 2 31))
488    (lis imm5 #x7fff)
489    (ori imm5 imm5 #xffff)
490
491    ;; combination
492    (u32-ref imm0 0 seed)
493    (cmplw cr7 imm0 imm2)
494    (sub imm0 imm0 imm2)
495    (bgt cr7 @finish)
496    (add imm0 imm0 imm5)
497    @finish
498    #+ppc32-target
499    (clrlwi imm0 imm0 3)                ;don't want negative fixnums
500    (box-fixnum arg_z imm0)
501    (blr)))
502
503
504(defppclapfunction %make-complex-double-float ((r arg_y) (i arg_z))
505  (get-double-float fp0 r)
506  (get-double-float fp1 i)
507  (li imm0 (logior (ash #+ppc32-target 5 #+ppc64-target 6 8) target::subtag-complex-double-float))
508  (subi allocptr allocptr (- #+ppc32=target 24 #+ppc64-target 32 target::fulltag-misc))
509  (twllt allocptr allocbase)
510  (str imm0 target::misc-header-offset allocptr)
511  (mr arg_z allocptr)
512  (clrrri allocptr allocptr target::ntagbits)
513  (stfd fp0 target::complex-double-float.realpart arg_z)
514  (stfd fp1 target::complex-double-float.imagpart arg_z)
515  (blr))
516
517(defppclapfunction %make-complex-single-float ((r arg_y) (i arg_z))
518  (get-single-float fp0 r)
519  (get-single-float fp1 i)
520  (li imm0 (logior (ash #+ppc32-target 3 #+ppc64-target 2 8) target::subtag-complex-single-float))
521  (subi allocptr allocptr (- 16 target::fulltag-misc))
522  (twllt allocptr allocbase)
523  (str imm0 target::misc-header-offset allocptr)
524  (mr arg_z allocptr)
525  (clrrri allocptr allocptr target::ntagbits)
526  (stfs fp0 target::complex-single-float.realpart arg_z)
527  (stfs fp1 target::complex-single-float.imagpart arg_z)
528  (blr))
529
530; End of ppc-numbers.lisp
Note: See TracBrowser for help on using the repository browser.