118 lines
4.7 KiB
LLVM
118 lines
4.7 KiB
LLVM
|
;RUN: llc < %s -march=r600 -mcpu=redwood
|
||
|
|
||
|
define amdgpu_vs void @main(<4 x float> inreg %reg0, <4 x float> inreg %reg1) {
|
||
|
main_body:
|
||
|
%0 = extractelement <4 x float> %reg1, i32 0
|
||
|
%1 = extractelement <4 x float> %reg1, i32 1
|
||
|
%2 = extractelement <4 x float> %reg1, i32 2
|
||
|
%3 = extractelement <4 x float> %reg1, i32 3
|
||
|
%4 = bitcast float %0 to i32
|
||
|
%5 = icmp eq i32 %4, 0
|
||
|
%6 = sext i1 %5 to i32
|
||
|
%7 = bitcast i32 %6 to float
|
||
|
%8 = bitcast float %7 to i32
|
||
|
%9 = icmp ne i32 %8, 0
|
||
|
%. = select i1 %9, float 0x36A0000000000000, float %0
|
||
|
br label %LOOP
|
||
|
|
||
|
LOOP: ; preds = %LOOP47, %main_body
|
||
|
%temp12.0 = phi float [ 0x36A0000000000000, %main_body ], [ %temp12.1, %LOOP47 ]
|
||
|
%temp8.0 = phi float [ 0.000000e+00, %main_body ], [ %38, %LOOP47 ]
|
||
|
%temp4.1 = phi float [ %., %main_body ], [ %52, %LOOP47 ]
|
||
|
%10 = bitcast float %temp4.1 to i32
|
||
|
%11 = icmp eq i32 %10, 1
|
||
|
%12 = sext i1 %11 to i32
|
||
|
%13 = bitcast i32 %12 to float
|
||
|
%14 = bitcast float %13 to i32
|
||
|
%15 = icmp ne i32 %14, 0
|
||
|
br i1 %15, label %IF41, label %ENDIF40
|
||
|
|
||
|
IF41: ; preds = %LOOP
|
||
|
%16 = insertelement <4 x float> undef, float %0, i32 0
|
||
|
%17 = insertelement <4 x float> %16, float %temp8.0, i32 1
|
||
|
%18 = insertelement <4 x float> %17, float %temp12.0, i32 2
|
||
|
%19 = insertelement <4 x float> %18, float 0.000000e+00, i32 3
|
||
|
call void @llvm.r600.store.stream.output(<4 x float> %19, i32 0, i32 0, i32 1)
|
||
|
%20 = insertelement <4 x float> undef, float %0, i32 0
|
||
|
%21 = insertelement <4 x float> %20, float %temp8.0, i32 1
|
||
|
%22 = insertelement <4 x float> %21, float %temp12.0, i32 2
|
||
|
%23 = insertelement <4 x float> %22, float 0.000000e+00, i32 3
|
||
|
call void @llvm.r600.store.stream.output(<4 x float> %23, i32 0, i32 0, i32 2)
|
||
|
%24 = insertelement <4 x float> undef, float %0, i32 0
|
||
|
%25 = insertelement <4 x float> %24, float %temp8.0, i32 1
|
||
|
%26 = insertelement <4 x float> %25, float %temp12.0, i32 2
|
||
|
%27 = insertelement <4 x float> %26, float 0.000000e+00, i32 3
|
||
|
call void @llvm.r600.store.stream.output(<4 x float> %27, i32 0, i32 0, i32 4)
|
||
|
%28 = insertelement <4 x float> undef, float 0.000000e+00, i32 0
|
||
|
%29 = insertelement <4 x float> %28, float 0.000000e+00, i32 1
|
||
|
%30 = insertelement <4 x float> %29, float 0.000000e+00, i32 2
|
||
|
%31 = insertelement <4 x float> %30, float 0.000000e+00, i32 3
|
||
|
call void @llvm.r600.store.swizzle(<4 x float> %31, i32 60, i32 1)
|
||
|
%32 = insertelement <4 x float> undef, float %0, i32 0
|
||
|
%33 = insertelement <4 x float> %32, float %temp8.0, i32 1
|
||
|
%34 = insertelement <4 x float> %33, float %temp12.0, i32 2
|
||
|
%35 = insertelement <4 x float> %34, float 0.000000e+00, i32 3
|
||
|
call void @llvm.r600.store.swizzle(<4 x float> %35, i32 0, i32 2)
|
||
|
ret void
|
||
|
|
||
|
ENDIF40: ; preds = %LOOP
|
||
|
%36 = bitcast float %temp8.0 to i32
|
||
|
%37 = add i32 %36, 1
|
||
|
%38 = bitcast i32 %37 to float
|
||
|
%39 = bitcast float %temp4.1 to i32
|
||
|
%40 = urem i32 %39, 2
|
||
|
%41 = bitcast i32 %40 to float
|
||
|
%42 = bitcast float %41 to i32
|
||
|
%43 = icmp eq i32 %42, 0
|
||
|
%44 = sext i1 %43 to i32
|
||
|
%45 = bitcast i32 %44 to float
|
||
|
%46 = bitcast float %45 to i32
|
||
|
%47 = icmp ne i32 %46, 0
|
||
|
%48 = bitcast float %temp4.1 to i32
|
||
|
br i1 %47, label %IF44, label %ELSE45
|
||
|
|
||
|
IF44: ; preds = %ENDIF40
|
||
|
%49 = udiv i32 %48, 2
|
||
|
br label %ENDIF43
|
||
|
|
||
|
ELSE45: ; preds = %ENDIF40
|
||
|
%50 = mul i32 3, %48
|
||
|
%51 = add i32 %50, 1
|
||
|
br label %ENDIF43
|
||
|
|
||
|
ENDIF43: ; preds = %ELSE45, %IF44
|
||
|
%.sink = phi i32 [ %49, %IF44 ], [ %51, %ELSE45 ]
|
||
|
%52 = bitcast i32 %.sink to float
|
||
|
%53 = load <4 x float>, <4 x float> addrspace(8)* null
|
||
|
%54 = extractelement <4 x float> %53, i32 0
|
||
|
%55 = bitcast float %54 to i32
|
||
|
br label %LOOP47
|
||
|
|
||
|
LOOP47: ; preds = %ENDIF48, %ENDIF43
|
||
|
%temp12.1 = phi float [ %temp12.0, %ENDIF43 ], [ %67, %ENDIF48 ]
|
||
|
%temp28.0 = phi float [ 0.000000e+00, %ENDIF43 ], [ %70, %ENDIF48 ]
|
||
|
%56 = bitcast float %temp28.0 to i32
|
||
|
%57 = icmp uge i32 %56, %55
|
||
|
%58 = sext i1 %57 to i32
|
||
|
%59 = bitcast i32 %58 to float
|
||
|
%60 = bitcast float %59 to i32
|
||
|
%61 = icmp ne i32 %60, 0
|
||
|
br i1 %61, label %LOOP, label %ENDIF48
|
||
|
|
||
|
ENDIF48: ; preds = %LOOP47
|
||
|
%62 = bitcast float %temp12.1 to i32
|
||
|
%63 = mul i32 %62, 2
|
||
|
%64 = bitcast i32 %63 to float
|
||
|
%65 = bitcast float %64 to i32
|
||
|
%66 = urem i32 %65, 2147483647
|
||
|
%67 = bitcast i32 %66 to float
|
||
|
%68 = bitcast float %temp28.0 to i32
|
||
|
%69 = add i32 %68, 1
|
||
|
%70 = bitcast i32 %69 to float
|
||
|
br label %LOOP47
|
||
|
}
|
||
|
|
||
|
declare void @llvm.r600.store.stream.output(<4 x float>, i32, i32, i32)
|
||
|
|
||
|
declare void @llvm.r600.store.swizzle(<4 x float>, i32, i32)
|