Array Operations

AppleAccelerate wraps Apple's vecLib (vv*) and vDSP (vDSP_*) functions to provide accelerated element-wise operations on Array{Float32} and Array{Float64}.

These functions are not exported to avoid conflicts with Base. Access them via the AppleAccelerate. prefix.

Element-wise Math Functions

These functions wrap Apple's vecLib vv* routines.

One-argument functions

Each function f has an allocating variant f(X) and a mutating variant f!(out, X):

Function	Description
`ceil`, `floor`, `trunc`, `round`	Rounding
`sqrt`, `rsqrt`, `rec`	Square root, reciprocal square root, reciprocal
`exp`, `exp2`, `expm1`	Exponentials
`log`, `log1p`, `log2`, `log10`	Logarithms
`sin`, `sinpi`, `cos`, `cospi`, `tan`, `tanpi`	Trigonometric
`asin`, `acos`, `atan`	Inverse trigonometric
`sinh`, `cosh`, `tanh`, `asinh`, `acosh`, `atanh`	Hyperbolic
`abs`, `exponent`	Miscellaneous

Two-argument functions

Function	Description
`copysign(X, Y)`	Copy sign of Y to X
`rem(X, Y)`	Element-wise remainder
`div_float(X, Y)`	Element-wise division (via vecLib)
`atan(X, Y)`	Two-argument arctangent
`pow(X, Y)`	Element-wise power

Special return types

Function	Description
`sincos(X)`	Returns `(sin(X), cos(X))` tuple
`cis(X)`	Returns `Complex` array `cos(X) + im*sin(X)`

X = randn(Float64, 1000)

# Element-wise math — 3–19× faster than Base
Y_exp = AppleAccelerate.exp(X)
Y_sin = AppleAccelerate.sin(X)
Y_log = AppleAccelerate.log(X .+ 10)  # shift to positive domain

# Mutating variant (pre-allocate output)
out = similar(X)
AppleAccelerate.exp!(out, X)

# Broadcasting works automatically
Y_broadcast = AppleAccelerate.sin.(X)

AppleAccelerate.sincos — Function

sincos(X::Array{T}) where T <: Union{Float32, Float64}

Compute the sine and cosine of each element simultaneously via vecLib vvsincos. Returns a tuple (sin(X), cos(X)) of arrays. Faster than computing sin and cos separately since both are produced in a single pass.

The mutating variant sincos!(out_sin, out_cos, X) stores results in preallocated arrays.

Function	Description
`vneg`	Negate each element: `result[i] = -X[i]`
`vnabs`	Negative absolute value: `result[i] = -
`vabs`	Absolute value: `result[i] = \|X[i]\|`
`vsq`	Square each element: `result[i] = X[i]^2`
`vssq`	Signed square: `result[i] = X[i] * \|X[i]\|`
`vfrac`	Fractional part: `result[i] = X[i] - trunc(X[i])`
`vreverse!`	Reverse vector in-place
`vreverse`	Return a reversed copy

Function	Description	Apple function
`maximum(X)`, `minimum(X)`	Max/min value	`vDSP_maxv`, `vDSP_minv`
`findmax(X)`, `findmin(X)`	Max/min value and index	`vDSP_maxvi`, `vDSP_minvi`
`sum(X)`, `mean(X)`	Sum and mean	`vDSP_sve`, `vDSP_meanv`
`meanmag(X)`	Mean of absolute values	`vDSP_meamgv`
`meansqr(X)`	Mean of squares	`vDSP_measqv`
`meanssqr(X)`	Mean of signed squares	`vDSP_mvessq`
`summag(X)`	Sum of absolute values	`vDSP_svemg`
`sumsqr(X)`	Sum of squares	`vDSP_svesq`
`sumssqr(X)`	Sum of signed squares	`vDSP_svs`
`dot`	Dot product: `sum(X .* Y)`	`vDSP_dotpr`
`distancesq`	Squared Euclidean distance: `sum((X .- Y).^2)`	`vDSP_distancesq`
`rmsqv`	Root mean square: `sqrt(sum(X.^2)/N)`
`sve_svesq`	Simultaneous sum and sum-of-squares
`maxmgv`	Maximum magnitude: `max(\|X\|)`
`minmgv`	Minimum magnitude: `min(\|X\|)`
`maxmgvi`	Maximum magnitude with index
`minmgvi`	Minimum magnitude with index

Function	Description	Apple function
`vadd` / `vadd!`	Element-wise addition	`vDSP_vadd`
`vsub` / `vsub!`	Element-wise subtraction	`vDSP_vsub`
`vmul` / `vmul!`	Element-wise multiplication	`vDSP_vmul`
`vdiv` / `vdiv!`	Element-wise division	`vDSP_vdiv`

Function	Description
`vmax`	Element-wise maximum
`vmin`	Element-wise minimum
`vmaxmg`	Element-wise maximum magnitude
`vminmg`	Element-wise minimum magnitude
`vdist`	Element-wise Euclidean distance
`vtmerg`	Tapered merge of two vectors

Function	Description	Apple function
`vsadd` / `vsadd!`	Vector + scalar	`vDSP_vsadd`
`vssub` / `vssub!`	Vector - scalar	`vDSP_vsadd`
`svsub` / `svsub!`	Scalar - vector	`vDSP_vsadd`
`vsmul` / `vsmul!`	Vector * scalar	`vDSP_vsmul`
`vsdiv` / `vsdiv!`	Vector / scalar	`vDSP_vsdiv`
`svdiv`	Scalar / vector	`vDSP_svdiv`

Function	Description
`vam`	`(A + B) * C`
`vsbm`	`(A - B) * C`
`vma`	`A * B + C`
`vmsb`	`A * B - C`
`venvlp`	Signal envelope

Function	Description
`vaam`	`(A + B) * (C + D)`
`vsbsbm`	`(A - B) * (C - D)`
`vasbm`	`(A + B) * (C - D)`
`vmma`	`A * B + C * D`
`vmmsb`	`A * B - C * D`
`vpythg`	Pythagorean distance

Function	Description
`vasm`	`(A + B) * c`
`vsbsm`	`(A - B) * c`
`vsma`	`A * b + C`
`vsmsa`	`A * b + c`
`vmsa`	`A * B + c`
`vsmsb`	`A * b - C`
`vsmsma`	`A * b + C * d`

Function	Description
`vclip`	Clip values to `[low, high]`
`vclipc`	Clip with count: returns `(clipped, nlow, nhigh)`
`viclip`	Inverted clip: pass values outside `[low, high]`
`vthr`	Threshold: keep or clamp to threshold
`vthres`	Threshold to zero
`vlim`	Test limit: `(b <= A[i]) ? c : -c`
`vthrsc`	Threshold with signed constant
`vcmprs`	Compress: gather elements where gate is nonzero

Function	Description
`vdouble`	Convert Float32 to Float64
`vsingle`	Convert Float64 to Float32

Function	Description
`vramp`	Generate a ramp: `start + i * step`
`vrampmul`	Multiply vector by a generated ramp
`vrampmul2`	Stereo ramp multiply (two outputs)

Function	Description
`vrsum`	Running sum scaled by `scale`
`vsimps`	Simpson's rule integration
`vtrapz`	Trapezoidal integration
`vswsum`	Sliding window sum
`vswmax`	Sliding window maximum

Function	Description
`vintb`	Linear interpolation: `A + t * (B - A)`
`vlint`	Linear interpolation from lookup table
`vqint`	Quadratic interpolation from lookup table

Function	Description
`vgathr`	Gather by index: `C[i] = A[B[i]]`
`vindex`	Index with float indices
`vgen`	Generate linear ramp between two values
`vgenp`	Piecewise linear interpolation from breakpoints
`vtabi`	Table lookup with interpolation

Function	Description
`vclr!`	Fill vector with zeros
`vfill!`	Fill vector with scalar value
`vswap!`	Swap two vectors in-place
`vsort!`	Sort vector in-place
`vsorti`	Return sort permutation (indices)

Function	Description
`mmul`	Matrix multiply: `C = A * B`
`mtrans`	Matrix transpose: `C = Aᵀ`
`mmov`	Matrix copy (submatrix move)

Function	Description
`vaddi`	Int32 vector addition
`vabsi`	Int32 absolute value
`vfilli!`	Fill Int32 vector with scalar
`veqvi`	Int32 bitwise XNOR

Direction	Functions	Description
float → signed int (truncate)	`vfix8`, `vfix16`, `vfix32`	Truncating conversion
float → unsigned int (truncate)	`vfixu8`, `vfixu16`, `vfixu32`	Truncating conversion
float → signed int (round)	`vfixr8`, `vfixr16`, `vfixr32`	Rounding conversion
float → unsigned int (round)	`vfixru8`, `vfixru16`, `vfixru32`	Rounding conversion
signed int → float	`vflt8`, `vflt16`, `vflt32`	Signed integer to float
unsigned int → float	`vfltu8`, `vfltu16`, `vfltu32`	Unsigned integer to float

Function	Description
`f3x3`	2D convolution with 3×3 filter
`f5x5`	2D convolution with 5×5 filter
`imgfir`	General 2D image convolution

Function	Description
`ctoz`	Interleaved complex → split (real, imag) vectors
`ztoc`	Split (real, imag) vectors → interleaved complex

Function	Description
`vneg(X)` / `vneg!(result, X)`	Negate: `-X`
`vabs(X)` / `vabs!(result, X)`	Modulus: `abs.(X)`
`vconj`	Complex conjugate
`vcopy`	Copy via split-complex move

Function	Description
`vphase`	Complex phase (angle)
`vmags`	Squared magnitude (`abs2`)
`vmagsa`	Squared magnitude + accumulate

Function	Description
`vmul(X, Y)` / `vmul!(result, X, Y)`	Element-wise multiply: `X .* Y`
`vdiv(X, Y)` / `vdiv!(result, X, Y)`	Element-wise divide: `X ./ Y`
`vsmul(X, c)` / `vsmul!(result, X, c)`	Scalar multiply (complex scalar)
`dot(X, Y)`	Unconjugated dot product: `sum(X .* Y)`
`zvadd`	Complex addition: `A + B`
`zvsub`	Complex subtraction: `A - B`
`zvcmul`	Conjugate multiply: `conj(A) * B`

Function	Description
`zrvmul`	Complex × real
`zrvdiv`	Complex / real
`zrvadd`	Complex + real (adds to real part)
`zrvsub`	Complex − real

Function	Description
`zvcma`	`conj(A)*B + C`
`zvma`	`A*B + C`
`zvsma`	`A*b + C` (b is complex scalar)

Function	Description
`zidotpr`	Conjugate dot: `sum(conj(A) .* B)`
`zrdotpr`	Complex-real dot: `sum(A .* B)`

Function	Description
`zvfill!`	Fill complex vector with scalar
`zconv`	Complex convolution
`zmmul`	Complex matrix multiply

Function	Description
`polar`	Cartesian to polar coordinates
`rect`	Polar to Cartesian coordinates